Méthodes de Clustering

Thème : Machine Learning non supervisé
24 heures
Data Scientist Data Analyst

Le clustering est un outil statistique qui consiste à partitionner les données, en constituant différents groupes (ou paquets) homogènes. La bibliothèque scikit-learn offre des algorithmes de partionnement applicables à tous types et toutes tailles de données, entre autres : K-means, Hierchical Clustering, Spectral clustering et Affinity Propagation.

Compétences acquises

- Identifier les problèmes de Machine Learning non supervisés
- Maîtriser les principaux algorithmes de clustering à l'aide d'une bibliothèque clé en Machine Learning, scikit-learn
- Connaître les métriques de performances associées aux problématiques de clustering, domaine clé dans la Data Analysis

Exemple de mise en pratique

- Le clustering au service de la Data Analysis : segmentation d'une base client marketing

- Cyber-Profiling

- Utilisation du clustering pour la reconstruction d'images

Fermer le menu