Le type data.table

Thème : Data Management
5 heures
Data Scientist Data Analyst

Le package data.table est une bibliothèque pour la création et la manipulation de tableaux de données dans un type appelé (lui aussi) data.table. L'innovation des data.table réside dans une syntaxe plus concise et est similaire à la syntaxe du langage SQL, et nous verrons que des manipulations habituellement complexes seront alors faciles à programmer et à décrypter. Aussi, les data.table propose la modification par assignation directe, qui rendent les manipulations efficientes.

Compétences acquises

- Créer et manipuler des tableaux de données aux format data.table en vue d'optimiser le fonctionnement d'algorithmes de Machine Learning

- Enchaîner fluidement des opérations sur ces tableaux

- Utiliser les symboles spéciaux de la bibliothèque

Exemple de mise en pratique

- Optimisation de code avec des programmes plus courts, plus puissants et plus rapide sur des gros fichiers de données.

- Génération automatiques de rapports/comptes rendus statistiques utilisés en Data Analysis

Fermer le menu