DataScientist : Recrutement VS Formation

Aurelia Fellous

Aurelia Fellous

4 min

Au cours de la dernière décennie, la Data Science est passée de quelques graines éparses à une forêt en croissance. Pour l’année 2020, on estime qu’environ 1,7 mégaoctets de nouvelles informations seront créées chaque seconde pour chaque être humain sur la planète et d’ici 2025, le marché de l’intelligence artificielle (IA) dépassera les 100 milliards de dollars (IDC).

Par ailleurs, et pour la 5ème année consécutive, le métier de Data Scientist a été désigné comme le meilleur emploi aux USA par Glassdoor et par le rapport 2019 U.S Emerging Jobs de LinkedIn. Le rapport indique également que c’est le métier qui connaît la croissance la plus rapide, avec 6,5 fois plus de membres qu’il y a cinq ans le déclarant comme profession.

L’heure est à l’expansion pour les équipes de Data Scientists, au sein d’entreprises de tous les secteurs. Deux choix s’offrent alors à elles :

  • Le recrutement d’éléments déjà formés, profitant notamment de la prolifération des formations initiales en Data Science.

Mais comment choisir entre ces deux solutions ? Les équipes de DataScientest ont posé le pour et le contre de chacun des deux options.

Le recrutement de Data Scientists : le choix de la simplicité

Recruter des Data Scientists présente de nombreux avantages.
Dans un premier temps, cela permet de focaliser la recherche sur un type de profil souhaité. Le recrutement de l’équipe permettra d’assigner une tâche à chacun en fonction de son profil, background universitaire, et de ses préférences. L’objet du recrutement sera, en somme, de créer une équipe efficace au sein de laquelle chacun réalise une mission clairement définie
D’autre part, les Data Scientists juniors terminent tout juste leurs études. Les connaissances dont ils auront besoin sont encore fraîches et leur vision de la fonction ne sera pas biaisée par des expériences précédentes et des éléments externes. La motivation et l’endurance inhérentes à la jeunesse de ces profils seront également mises à profit dans leur activité et aideront à obtenir de meilleurs résultats. Recruter des individus ayant entre 0 et 5 ans d’expérience permet d’être face à des profils à l’aise avec les technologies de l’écosystème data, en possession de bases théoriques solides et des compétences dans la mise en pratique.
Toutefois, le recrutement implique, comme dans tous les postes et à fortiori ceux à forte dimension technique, un coût non négligeable pour l’entreprise. En effet, une batterie d’entretiens et de tests devront être mis en place pour intégrer de nouveaux éléments, ce qui impliquera des sacrifices tant financiers qu’organisationnels. Que l’entreprise fasse le choix de sous-traiter ou de prendre en charge l’ensemble du process en interne, il faudra investir du temps, de l’argent, et de l’énergie pour parvenir à avoir une équipe Data Science efficace et productive.
De plus, les profils dont il est question ici sont encore rares. Les candidats n’ont souvent que peu d’expérience-métier (relative au secteur de l’entreprise dans laquelle ils pourraient être amenés à évoluer) mais ils ont surtout des revendications salariales importantes du fait de leurs parcours académiques : 88% d’entre eux sont titulaires d’un master et 46% d’un doctorat, au sein de formations très sélectives, pour la plupart en mathématiques et statistiques, en sciences de l’informatique ou en grande école ingénieur. Ils font partie d’un marché en pénurie de profils.

La formation de collaborateurs déjà en poste : un pari gagnant ?

Si le recrutement de Data Scientists implique un coût substantiel tant sur le plan financier qu’organisationnel, la formation de collaborateurs déjà en poste ou “reskilling” bénéficiera d’une bien plus grande facilité de mise en place. En effet, celle-ci sera la plupart du temps sous-traitée et aucune adaptation organisationnelle ne sera nécessaire pour l’entreprise.
Ajoutons à cela que ce type de formation est largement financé par des subventions d’entreprises et qu’elles constituent un coût déjà maîtrisé par les groupes : par exemple, un chargé d’études statistiques ne demandera pas une augmentation de salaire faramineuse à l’issue de sa formation alors que le recrutement d’un Data Scientist pourrait s’avérer onéreux.
Au-delà de cette simplicité, le reskilling de collaborateurs aura pour résultat l’intégration de Data Scientists plus “généralistes”. Forts des compétences-métier acquises tout au long de leurs carrières, ils apporteront une vision plus transversale : ils ont déjà une connaissance des données de l’entreprise et auront, par conséquence, une manipulation plus pertinente de ces-dernières. 
Les profils reskillés sont en général des chargés d’études statistiques, des opérateurs de web marketing, ou plus simplement des actuaires, qui peuvent monter en compétence en 9 mois à raison d’une heure par jour.
En pratique, le but de la Data Science n’est pas d’exécuter. Son objectif consiste plutôt à apprendre et à développer en profondeur de nouvelles capacités professionnelles. Les produits algorithmiques tels que les systèmes de recommandations, la classification des préférences, les optimiseurs de logistique, la prévision des tendances saisonnières, etc. ne peuvent pas être conçus à l’avance. Ils ont besoin d’être appris. Il n’y a pas de plan à suivre ; ce sont des capacités nouvelles empreintes d’incertitude. Les coefficients, les modèles, les types de modèle, les hyper-paramètres, tous les éléments nécessaires doivent être précisés par le biais d’expérimentations, d’erreurs et d’itérations.
Cependant, l’un des inconvénients de cette alternative réside dans le fait que les profils en question sont expérimentés et par conséquent, parfois réfractaires au changement. Cela pourrait néanmoins être atténué par leur appétence pour l’acquisition de compétences.

La solution miracle : un choix hybride et spécifique à chaque entreprise

Le flux de données créées et recueillies explosant d’années en années, il paraît clair que les entreprises de tous les secteurs n’échapperont pas à une refonte complète de leurs équipes data science.
Deux choix s’offrent alors à elles : recruter des Data Scientists fraichement diplômés, qui constitueront une équipe efficace et productive au sein de laquelle chacun sera le maillon d’une chaîne, ou former des collaborateurs déjà en poste. Moins spécialisés mais plus transversaux, ces-derniers seront capables d’atteindre des objectifs plus ambitieux en apprenant et itérant tout au long de leur activité. 
Le choix sera donc fait en fonction du secteur et des objectifs des entreprises ainsi que du poids qu’elles comptent donner à leurs équipes Data. Plus la restructuration recherchée sera profonde, plus elles auront intérêt à recruter des Data Scientists déjà formés.
À l’inverse, des secteurs nécessitant une connaissance métier fondamentale dans la bonne conduite d’un projet devront plutôt faire appel au reskilling dans un premier temps, avant de pouvoir ensuite compléter leurs équipes avec des “pépites” porteuses de fraicheurs ; c’est par exemple le cas dans l’assurance.

En somme, les entreprises ne devront pas perdre de vue que le poids des Data Sciences sera amené à exploser au fil des prochaines années comme le confirment toutes les études réalisées sur ce sujet (Direction générale des entreprises, rapport technologies clés réalisé par le ministère de l’économie et des finances etc.). Leur succès reposera surtout sur leur capacité à s’adapter et à opérer les choix stratégiques nécessaires à leur pérennité.

Actualité data

DataScientist : Recrutement VS Formation

Pour la 5ème année consécutive, le métier de Data Scientist a été désigné comme le meilleur emploi aux USA par Glassdoor c’est aussi le métier qui connaît la croissance la plus rapide.

Lire plus »
Intelligence Artificielle et Société

Ethique ou Big Data

Comment faire prévaloir une question d’éthique en matière de données alors que la concurrence se veut mondiale ? Les européens doivent-ils se soumettre à une concurrence américaine et asiatique déloyale pour une question d’éthique ?

Lire plus »