Les diagrammes en pie chart (plus communément appelés "camembert" dans la langue de Molière) font certainement partie des types de graphiques les plus connus. Ils sont utilisés pour représenter un petit nombre de variables réparties en “part” ou secteurs dont la taille est fonction de la valeur.
Très présents dans le monde du journalisme ou encore de la finance, ils sont en revanche plus rares dans la data. La raison à cela est principalement due au fait que les Data Engineers ou les Data Analysts préfèrent des types de graphiques plus précis pour présenter leurs données.
Dans quels cas peut-on utiliser les pie charts ?
- Lorsque les données à représenter ne dépassent pas 7 variables. En effet, au-delà ; il devient difficile d’analyser différents angles et ainsi comprendre les proportions.
- Idéalement lorsqu’une catégorie dépasse les autres largement, le lecteur aura ainsi une vision évidente de la part la plus représentée
- Pour faire comprendre rapidement et simplement de larges volumes de données réparties en seulement quelques catégories
Quand ne pas les utiliser ?
- Si les données à visualiser représentent un trop grand nombre de variables
- Lorsque les valeurs des données sont équitablement réparties (ou à peu près)
- Si les données peuvent être négatives (effectivement, il est impossible de représenter des valeurs négatives avec un pie chart), ou lorsque les pourcentages n’atteignent pas les 100%
Comment utiliser les pie charts au mieux ?
Lorsque l’on décide de présenter des informations dans un graphique en camembert, il faut donc garder à l’esprit les points précédents. Mais il est également très important de suivre quelques recommandations : les différentes parts doivent être correctement labellisées pour permettre une lecture optimale, et ces labels doivent être rattachés directement à la part qui les concerne ; les effets visuels sont à proscrire, car ils nuisent à la compréhension des graphiques (effets en 3D, explosé, etc).
Le tableau ci-dessous contient des exemples de choses à faire et ne pas faire avec des diagrammes en camembert :
Lors de leurs élaborations, en réalisant de premiers essais visuels, il peut être pertinent de se poser les questions suivantes :
- Les parts sont-elles à peu près égales ?
- Ai-je plus de 7 variables à représenter ?
- Est-ce que mes données sont compréhensibles ? (se positionner à la place d’un lecteur lambda)
Conclusion
Vous l’aurez certainement compris, les diagrammes dits « camembert » peuvent s’avérer utile dans certaines circonstances, et selon le public visé, du moment qu’ils restent simples et facilement compréhensibles.
En revanche, on les proscrit dans de nombreuses applications, et essentiellement dans le domaine de la data, où la visualisation d’information doit être beaucoup plus précise, et où d’autres indicateurs procurent de meilleurs résultats.
Il est également très facile de se laisser séduire par l’apparente facilité d’élaboration d’un tel graphique en voulant pousser la personnalisation et son esthétisme. Cela devient contre productif, car de manière naturelle, l’œil humain perdrait les informations essentielles.
La formation en data science permet d’en apprendre plus sur l’importance de la dataviz (Data Visualisation), et ainsi de maîtriser des outils pour aller plus loin.