Data Processing et Machine learning avec PySpark

Thème : Database,Big Data
24 heures
Data Scientist Data Analyst

PySpark est la bibliothèque de référence pour faire du Machine Learning sur des données distribuées en environnement Big Data. Cette formation se concentre sur différents algorithmes de classification et de régression. Ce tutoriel vous apprend aussi à paramétrer les différents algorithmes au travers de cas d'application sur des bases de données réelles.

Compétences acquises

- Formation au traitement des jeux de données massifs, à l'aide du calcul distribué
- Appliquer des modèles de Machine Learning à de grandes bases de données, de manière performante

Exemple de mise en pratique

- Détection d'événements en temps réel
- Prédire le taux d'attrition à grande échelle

Fermer le menu