Les méthodes propres aux projets big data

-
3
 m de lecture
-
big data projet

La numérisation de la donnée et l’essor du big data ont provoqué un afflux massif d’informations au sein des entreprises. Beaucoup d’informations produites mais aussi beaucoup d’informations à traiter. Pourtant cette masse de données représente un véritable enjeu économique et stratégique pour les entreprises, à condition de savoir bien les traiter et les utiliser en déployant les bonnes méthodes pour ses projets big data.

Trop d’informations tue l’information, c’est ce que l’on a coutume de dire. Et cela semble se vérifier avec la montée en puissance du Big Data. Avec la multiplication et le développement des supports numériques, les entreprises doivent faire face à un afflux de données à gérer. Si les entreprises commencent à comprendre l’importance de traiter ces volumes de données et de leur valeur, il n’est en revanche pas toujours facile pour elles de traiter ces données rapidement. Un traitement rapide des données implique la mise à disposition immédiate des outils de big data, d’où l’importance de connaître les méthodologies projets à déployer pour conduire un projet de big data efficace.

Quelles méthodes propres utiliser pour réussir ses projets Big Data ?

La gestion de projet big data fait appel à différentes méthodologies en fonction des équipes métiers mais aussi des modes.

La méthode CRISP dans les projets Big Data

La méthode CRISP, appelée CRISP-DM à sa création en 1996 par IBM, a été conçue à la base pour des projets de data mining. Totalement indépendante des outils et technologies utilisés en entreprise, cette méthode doit son succès et sa généralisation à tous projets de big data grâce à son schéma d’application standard. Bâtie en six étapes, la méthode CRISP est idéale pour résoudre un problème défini tant elle met l’accent sur l’identification des besoins et sur les objectifs métiers :

  • étape 1 : compréhension du problème métier ;
  • étape 2 : compréhension des données ;
  • étape 3 : préparation des données ;
  • étape 4 : modélisation des données ;
  • étape 5 : évaluation ;
  • étape 6 : déploiement.

Avec son approche cyclique et itérative, la méthode CRISP permet ainsi de s’adapter en fonction de l’avancée du projet car elle encourage à la collaboration et à la communication entre l’équipe projet et les experts métiers, et favorise les retours en arrière. Compatible avec des méthodologies agile, la méthode CRISP est ainsi très largement utilisée pour des projets Big Data ou de l’analyse prédictive.

Les méthodes Agiles dans le Big Data

Conçue à la base pour des projets data, la méthode CRISP peut néanmoins manquer d’agilité dans certains projets, dans le sens où elle ne met pas au centre du process, le client et la production de valeur. C’est pourquoi différentes variantes sont apparues au fil des ans :

  • AgileKDD : cette méthode est fondée sur le cycle de vie OpenUp, fondé sur quatre phases à savoir inception, élaboration, construction et transition. Chaque phase contient une ou plusieurs itérations divisées en séquences, sprints, planifiées sur des délais fixes.
  • ASUM-DM : développée par IBM, la méthode ASUM-DM est une extension à CRISP-DM, combinant agilité et gestion de projet traditionnelle. Elle se déroule en 3 phases principales qui sont une grande phase d’analyse et compréhension métier et données, de design puis de configuration et construction, une phase de déploiement et une troisième phase d’opération et optimisation.

Les méthodes propres aux projets Big Data

D’autres méthodes  pour réaliser des projets big data ont également été développées. C’est le cas par exemple de la méthode Stampede ou de la méthode AABA.

Développée par IBM pour ses clients, la méthode Stampede s’appuie sur la mise à disposition de ressources d’experts. Elle doit permettre à toute entreprise de se lancer rapidement dans un projet générant de la valeur à partir du big data. Stampede s’applique dans le cadre d’un projet pilote défini après une séance de travail intensive d’environ quatre mois servant à déterminer le projet big data, identifier les ressources nécessaires, organiser un plan de travail et définir la valeur générée pour l’entreprise.

La méthode AABA, pour Architecture-centric Agile Big Data Analytics, est centrée sur le modèle DevOPs. Elle intègre à la fois une architecture AAA ainsi que la conception base de données du système big data. Grâce à son agilité, la méthode AABA permet de s’adapter rapidement à l’évolution des besoins et des technologies.

Comme on peut le voir, il n’y a pas une seule méthode big data  idéale pour chaque projet. Les expertises métiers étant différentes dans chaque entreprise, il n’est pas toujours facile de trouver la méthode projet big data qui s’adapte à chaque situation. Chaque méthode big data a ses avantages et ses inconvénients, l’essentiel réside dans l’implication des forces en présence et de la capacité des équipes, aussi bien techniques que métiers, à s’adapter et évoluer dans le but d’améliorer sans cesse le projet final en créant de la valeur.

Si vous êtes intérressé par les projets big data ou bien la data science de façon plus globale, n’hésitez pas à contacter notre équipe pour discuter du métier de Data Engineer, un métier qui traite toutes ces problématiques !

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?