DataViz : Définition, objectifs et usages

-
3
 m de lecture
-
DataViz

La Data Visualization, souvent appelée « Dataviz », est l’ensemble des techniques qui permettent la transformation visuelle et la synthétisation de données brutes pour les faire parler.

Le saviez-vous ?

La « Dataviz » est un procédé de transmission de l’information qui remonte à plusieurs siècles.

Au XVIIIe siècle, l’ingénieur et économiste William Playfair invente l’histogramme, le diagramme circulaire et les séries temporelles, 3 types simples de graphiques toujours largement utilisés de nos jours.

Dataviz
1 - William Playfair (1759 - 1823), pionnier de la dataviz

Aujourd’hui, la Dataviz est présente partout, que ce soit dans le dernier rapport d’Analyse de votre site web ou dans les médias les plus mainstream. C’est également un puissant outil de communication que l’on peut mettre à profit en Data Science.

Imaginons le cas où vous venez de terminer une analyse exhaustive d’une base de données comportant les achats et les caractéristiques de nombreux consommateurs. Au cours de votre analyse vous avez dû remarquer tout un tas d’informations très utiles, par exemple, l’impact de la stratégie de promotion décidée par votre entreprise. Vous avez sûrement défini des indicateurs de performance pour crédibiliser votre analyse. Vous vous retrouvez donc avec une quantité importante d’informations chiffrées qui en l’état sont difficilement compréhensibles de tous. 

Comment résumer votre analyse de manière intelligible et claire sans passer par des tableaux chiffrés indigestes ? 

C’est là que la Dataviz entre en scène.  La visualisation de données vous offrira un ensemble de techniques permettant la transformation de données brutes et souvent complexes en représentations visuelles accessibles afin de les rendre compréhensibles rapidement au plus grand nombre.

En utilisant des graphiques comme des diagrammes circulaires ou des histogrammes vous parviendrez à synthétiser, organiser votre analyse.

De plus, l’accès aux données devient plus rapide, pertinent et facilite leur partage et leur utilisation par différentes branches.

Vous pourrez raconter l’histoire de votre analyse, faire appel à ce qu’on nomme du storytelling. Mieux qu’illustrer il faut dérouler, à l’aide des outils qu’offre la dataviz les étapes de votre raisonnement jusqu’à la conclusion.

Comment faire de la Dataviz avec Python ?

Python s’est imposé comme le langage à utiliser, ces dernières années, pour explorer et analyser des ensembles de données.

L’un des avantages de Python est de pouvoir utiliser ce même langage gratuit et open-source pour de nombreuses tâches de Data Science comme l’exploration de données, l’analyse statistique, le Machine Learning et la visualisation de données.

Matplotlib est la première bibliothèque Python permettant de générer et gérer plusieurs types de graphiques, de manière assez simple et ordonnée.

C’est également la plus utilisée en Data Science avec Python, et la plus répandue dans les formations à la Data Vizualisation.

matplotlib
2- Graphiques réalisés avec Matplotlib

De nombreuses autres bibliothèques, s’appuyant sur Matplotlib, ont vu le jour permettant de moderniser les graphiques et de rendre encore plus simple leur création.

C’est le cas notamment de Seaborn, très appréciée pour ses graphiques statistiques et sa simplicité déconcertante.

Cette bibliothèque s’utilise en complément de Matplotlib. Pour la gestion avancée du design de votre graphique, titres, cadre, axes, Matplotlib se révélera indispensable tandis que Seaborn sera plus appréciée pour son esthétique.

3- Graphique Seaborn
3- Graphiques Seaborn

Plus récemment, l’apparition de bibliothèques comme Plotly ou Bokeh, permettent de créer des graphiques interactifs de haut niveau, qui s’intègrent facilement dans une page web, sans avoir besoin de maîtriser JavaScript.

4- Graphique Plotly
4- Graphique Plotly
5 - Graphique Bokeh
5 - Graphique Bokeh

Avec des bibliothèques spécialisées comme Holoviz ou Geoviews, vous pourrez également créer de manière rapide, des dataviz cartographiées, très prisées par les médias.

Holoviz
6- Graphique Holoviz

Il existe encore beaucoup d’autre outils, comme Dash qui permet de créer des dashboards et applications Web avec vos graphiques.

Tous ces packages ont l’avantage d’être très bien documentés et d’être facilement utilisables (à condition d’avoir préalablement travaillé sur ses données). Ils vous permettront d’afficher et de sauvegarder des graphiques de bon niveau synthétisant efficacement les informations de votre jeu de données en fonction du message que vous voulez faire passer.

Vous pourrez afficher jusqu’à 4-5 informations facilement dans un même graphique, et grâce à 2 lignes de code, avec certaines fonctions de Seaborn.

Pour une application web contenant plusieurs graphiques interactifs, il faudra un code plus long, à vous de définir l’investissement qui vous conviendra en fonction du résultat attendu.

Curieux d’en apprendre davantage en DataViz ?
Découvrez notre track spécialisé !

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?