Méthodes de réduction de dimension

Thème : Machine Learning non supervisé
24 heures
Data Scientist

Lorsque les volumes de données traitées sont trop importants, ou bien que les colonnes de vos tables sont trop corrélées, il est parfois indispensable de savoir réduire la taille de son jeu de données en perdant un minimum d'informations. Ce tutoriel vous propose une introduction à la réduction de dimensions à l'aide de la bibliothèque scikit-learn, et couvre notamment les algorithmes : Feature Selection, PCA, LDA, et des méthodes de manifold learning.

Compétences acquises

- Réduire la taille d'un jeu de données de manière optimale sans perte d'information
- Visualiser les relations entre les variables d'un grand jeu de données, à l'aide d'outils de Data Visualisation
- Repérer visuellement des structures afin de déterminer l'algorithme de Machine Learning adéquat

Exemple de mise en pratique

- Etude de consommations clients

- Reconnaissance faciale

- Analyse de données sensorielles

Fermer le menu