Spark

Thème : Big Data : Volume
15 heures
Data Ingenieur

Spark est moteur de traitement parallèle de données capable de modéliser rapidement des grands ensembles

Compétences acquises

- Formation à l'outil Spark très utilisé pour manipuler et modéliser des grands ensembles de données

Exemple de mise en pratique

- Machine Learning avec Pyspark
- Préparation des données avec Pyspark
- Pipelines Extract Load Transform

Fermer le menu