Certificat Data Analyst

Le Data Analyst a une connaissance globale de l’ensemble du pipeline Data. Son objectif est d’interpréter les différentes analyses. Il répond à des problématiques business ou stratégiques. De bonnes compétences en Data Viz, en Business Intelligence ou encore en Machine Learning sont nécessaires pour mener à bien ses missions. 

Data analyst perso

Modalité
d'évaluation

Durant la formation, le responsable de cohorte apprécie objectivement l’acquisition  des compétences du candidat au travers de divers travaux pratiques dans un environnement dédié et par la mise en place d’un contrôle continu de connaissance du candidat. À la fin de chaque session, un test d’évaluation chronométré sur un use case en data science en lien direct avec le bloc d’activité valide l’acquisition des compétences techniques. Ce test permet  d’évaluer le niveau de connaissance du candidat de manière objective dans un cas concret et ainsi s’assurer de la maîtrise des compétences techniques de base.

Les candidats sont également mis en situation professionnelle par l’intermédiaire de résolution de cas pratique d’entreprise réel ou fictif directement lié au bloc d’activité, qu’ils présentent oralement devant un jury composé de professionnels de la data science en poste depuis 3 à 5 ans et de membres de la direction pédagogique.

Les
compétences

Préparation et Programmation des données en vue d'une analyse statistique

  • Activités
  • Compétences
  • Lire et comprendre les langages de programmation les plus utilisés pour une analyse de données
  • Manipuler et gérer les tableaux de données
  • Interroger, manipuler, ordonner et modifier un jeu de données
  • Automatisation

 

  • Cibler la problématique et déterminer les objectifs d'une demande d'analyse statistique 
  • Lire un jeu de données, en prenant en compte sa structure, le manipuler et le traiter  afin de répondre à une demande d'analyse externe ou interne. 
  • Choisir le langage de programmation et les bibliothèques pertinentes pour assurer une analyse efficiente en fonction de la problématique posée.
  • Entraîner un modèle de classification ou de régression à l'aide de l'apprentissage supervisé pour répondre à la problématique posée .
  • Évaluer le modèle mis en place et effectuer les ajustements nécessaires dans le but de l'améliorer.
  • Automatiser le modèle d'analyse afin de récolter des résultats de qualité et actualisés en permanence

Visualisation des données (dataviz- data storytelling)

  • Activités
  • Compétences
  • Maîtriser, customiser une grande variété de rendus graphiques 
  • Mettre la Data Visualisation au service de la Data analysis au service d'une problématique métier
  • Produire des graphiques statistiques au croisement de la Data Visualisation et Data Analysis
  • Utiliser une grande variété de rendus graphiques (nuage de points, graphes, camembert, histogramme etc.…)  en employant les outils dédiés (Matplotlib, Seaborn,Bokeh, etc ...) afin de présenter de manière lisible et intelligible les résultats d'une analyse statistique d'un jeu de données
  • Produire des graphiques statistiques d'analyse de corrélations pertinents afin de faire ressortir les interactions
  • Élaborer un Dashboard interactif afin de diffuser une vision pertinente des résultats d'analyse aux différentes équipes
  • Concevoir un Data Storytelling efficient en prenant compte les besoins, les données exploitées, et le public afin de donner un sens aux données et rendre l'analyse compréhensible .
  • L'ensemble de la démarche d'analyse, les méthodes et outils employés sont consignés dans un fichier (et/ou un executable) accessible à d'autres utilisateurs 

Algorithme de Machine learning

  • Activités
  • Compétences
  • Implémenter des techniques d'analyse de données, et des analyses statistiques multivariées
  • Implémenter un algorithme de Machine Learning statistique
  • Pré-traiter les données afin qu'elles conviennent aux modèles utilisés
  • Évaluer un modèle à l'aide de la validation croisée et de différentes métriques
  • Maîtriser les algorithmes d'ensemble de type boosting et bagging 
  • Identifier les problèmes de Machine Learning non supervisés
  • Maîtriser les principaux algorithmes de clustering 
  • Connaître les métriques de performances associées aux problématiques de clustering
  • Maîtriser le modèle de régression linéaire simple
  • Maîtriser les modèles de régression logistique, pénalisés et Elastic-Net
  • Connaître les principales métriques d'évaluation des modèles de régression
  • Utiliser les concepts fondamentaux de classes, d'héritage et de polymorphisme afin de concevoir en un minimum de lignes des systèmes où des programmes, qui seront réutilisés de nombreuses fois.
  • Implémenter des modèles de classification dans le but de classer des observations à partir de variables qualitatives ou quantitatives en s'adaptant à des situations complexes
  • Implémenter des modèles de régression afin de quantifier des observations à partir de variables qualitatives ou quantitatives 
  • Implémenter des algorithmes de segmentation (Clustering), en s'appuyant sur des jeux de données non annotés afin de répondre à la problématique
  • Appliquer la méthode de réduction de dimension appropriée pour faire face à des jeux de données volumineux dans le but de les réduire pour les rendre exploitables

Stockage et gestions du Big Data

  • Activités
  • Compétences
  • Lire et Interroger les bases de données relationnelles
  • Maîtriser la syntaxe des requêtes SQL
  • Traitement des jeux de données massifs, à l'aide du calcul distribué
  • Appliquer des modèles de Machine Learning à de grandes bases de données
  • Utiliser le langage informatique approprié afin d'implémenter des requêtes et gérer des bases de données relationnelles à l'aide d'une syntaxe simple et utilisable sur une grande variété de logiciels
  • Extraire une table des bases de données internes afin d'élaborer un modèle de Machine Learning dans le but de répondre à une problématique métier 
  • Manipuler des jeux de données massifs en architecture distribuée et entraîner des modèles de Machine Learning sur de grandes bases de données de manière performante afin d'obtenir des prédictions en réponse à une problématique métier 

Extraction et gestion de données non structurés (option : texte, web, images et graphes)

  • Activités
  • Compétences
  • Comprendre l'architecture d'un site Internet
  • Maîtriser les techniques de manipulation et prétraitement de données textes
  • Utiliser un modèle de Machine Learning sur données textes
  • Lire, manipuler et pré-traiter les données textes à l'aide des librairies de programmation dédiés dans le but de créer un jeu de données à exploiter 
  • Maîtriser les techniques de manipulation et de prétraitement de données textes afin d'extraire des informations de haute qualité à l'aide de l'apprentissage de modèles statistiques
  • Utiliser les bibliothèques d'analyse syntaxique de documents HTML et XML afin d'automatiser la récupération des données de documents HTML et XML provenant de diverses pages internet
  • Utiliser un modèle pertinent de Machine Learning sur des données textes afin d'obtenir des informations de qualité en réponse à la problématique métier

Les
prérequis

Nos aprennants

Les métiers de la Data s’ouvrent à de nouveaux profils. Pour notre formation Data Analyst, nos apprenants ont un niveau d’étude Bac +3 minimum. Le métier de Data Analyst évolue et se diversifie. Aujourd’hui, de nombreux Data Analyst se lancent en freelance ou répondent à des missions chez le client.

De nombreux demandeurs d’emploi se positionnent sur le marché du travail grâce à notre career service !

La place des femmes dans nos parcours

Selon l’étude du BCG What’s Keeping Women Out of Data Science, les femmes représentent 20% des Data Scientists en poste. DataScientest s’engage pour encourager l’insertion des femmes dans les métiers de la Data.

L’employabilité

Le taux d’employabilité de nos apprenants pour les trois dernières années est de :
  • 93 % dans les 6 mois qui suivent la formation
  • 95 % dans l’année qui suit la formation
L’année 2020 a été marquée par la crise sanitaire qui a impacté le marché du travail. Cependant les métiers de la Data font partie des métiers épargnés par la crise. Le délai avant l’embauche a été rallongé mais le taux d’embauche reste élevé. 

Le salaire moyen de nos Alumnis est de 36 300 € :

Quels secteurs après la formation ?

Les métiers de la Data se développent dans de nombreux secteurs. Les équipes Data dans l’industrie ou l’assurance ont déjà une certaine maturité. De nouvelles opportunités se développent, notamment dans le secteur de la santé ou du luxe.

Questions
fréquentes

Les nouvelles technologies ont évolué de telle sorte à ce que nous disposons aujourd’hui d’une quantité astronomique de données. Une des premières sources? Les entreprises. Dès lors, leur enjeu est devenu de réussir à comprendre et trier ces données. Pour ce faire, de nouveaux métiers ont vu le jour. Parmi eux, le métier de Data Analyst est l’un des premiers à avoir émergé de la sphère Data, pour le plus grand bien des entreprises. 

Pour réussir à mieux cerner les compétences les plus importantes pour un Data Analyst en 2020, nous avons interrogé 25 responsables Data de groupes du CAC 40 (Crédit Agricole, BNP Paribas, AXA…)

Ils ont dans l’ordre priorisé : 

  • La connaissance de l’entreprise et de son corps de métier
  • La maîtrise des statistiques
  • La bureautique et programmation
  • Soft-skills: marketing, anglais et notions juridiques

Évidemment, l’objectif du Data Analyst est de maîtriser au mieux chacune de ces compétences : le must étant bien sûr une formation propre à ce métier qui saura vous professionnaliser et mettre en valeur chacun de ces aspects.

Découvrez notre dossier si vous souhaitez découvrir le métier de Data Analyst dans sa totalité : missions, compétences requises, salaires. Cliquez ici ! 

Pour plus d’informations , consultez la vidéo.

Les missions types du Data Analyst sont plurielles et font appel à diverses compétences :

  • Production, mise en page et communication de rapports pour une prise de décision
  • Analyse, étude et traitement de données
  • Détection de modèles à partir des Datas collectées 
  • Acquisition de données en collaboration avec les autres métiers de la Data (data architect, data steward…) 

En fonction du type et de la taille de la structure dans laquelle œuvre le Data Analyst, ses fonctions et tâches peuvent évidemment être amenées à changer ou à pencher plus vers une forme d’action. 

Les missions du Data Analyst sont également basées sur les quatre différents types d’analytics: 

  • “Descriptive analytics” : Que s’est-il passé ?
  • “Diagnostic analytics” : Pourquoi ceci s’est-il passé ainsi ? 
  • “Predictive analytics” : Qu’est-ce qui est susceptible d’arriver ? 
  • “Prescriptive analytics” : Quelles actions doivent être prises ?
Vous souhaitez en savoir plus sur les missions du Data Analyst ? Cliquez ici ! 
 
Cette formation est en général proposée aux individus d’un niveau BAC+2 à composante Scientifique ou business. Une sensibilité aux problématiques métiers est indispensable et des notions en statistiques et marketing sont appréciées. Plus spécifiquement, les compétences appréciées au départ de la formation sont :

Une fois inscrit sur le site, un membre de nos équipes vous contacte pour vous présenter DataScientest, nos offres et échanger sur votre parcours et votre projet professionnel. Ceci afin de s’assurer que la formation que vous voulez suivre soit cohérente avec vos attentes.

Pour identifier votre niveau au début de la formation, vous aurez à passer un test technique de positionnement. Il porte sur des notions mathématiques de probabilité/statistique et d’algèbre basique (niveau L1/L2 mathématiques).

Ensuite, un membre de notre équipe d’admission vous contacte pour vous communiquer les résultats et discuter de vos motivations et de la pertinence de votre projet.

Jusqu’ici, il n’y a aucun engagement avec DataScientest et vous pouvez donc décider à tout moment de ne plus poursuivre vos démarches.

La phase d’inscription ne débute qu’une fois le projet confirmé. Dès ce moment là, nos équipes se chargent de débuter votre formation en Data Analyse et de l’organiser avec vous dans tous ses aspects pratiques que ce soit une formation professionnelle continue ou au format bootcamp.

Pour allier flexibilité et motivation, la pédagogie de DataScientest repose sur une formation professionnelle hybride joignant distanciel et présentiel pour que la motivation soit toujours au rendez-vous. 

Plus de détails sur les avantages de cet apprentissage unique sont disponibles dans cet article  ! 

Notez qu’il est possible de suivre cette formation à distance. Les cours sont dispensés en visioconférence mais le suivi reste identique avec des professeurs disponibles et attentifs à votre progression tout au long de votre qualification professionnelle.

Pour comprendre notre mode d’apprentissage en 2 min découvrez cette vidéo,

Notre formation Data Analyst est conçue pour vous permettre de savoir : 

  • Lire et comprendre un code Python
  • Manipuler et gérer les tableaux de données (compétence clé en Machine Learning)
  • Mettre la Data Visualisation au service de l’analyse de données 
  • Produire des graphiques statistiques simples au croisement de la Data Visualisation et Data Analysis
  • Implémenter un algorithme de Machine Learning classique et l’utiliser sur des données textes
  • Évaluer un modèle à l’aide de la validation croisée et de différentes métrics
  • Identifier les problèmes de Machine Learning non supervisé
  • Traiter des jeux de données massifs et appliquer des modèles de Machine Learning à de grandes bases de données
  • Maîtriser des outils avancés en Data Analysis pour orienter la stratégie d’entreprise

Cliquez-ici pour télécharger notre fiche métier Data Analyst

  • Contrôle continu permettant de valider les blocs de compétences
  • Soutenance orale devant un jury de professionnels
L’obtention de la certification nécessite la validation de tous les blocs de compétences . Possibilité de validation par bloc de compétences.
 
L’acquisition des compétences s’effectue au travers de divers travaux pratiques effectués dans un environnement dédié et par la mise en place d’un contrôle continu de connaissance.