Le nuage de mots ou « wordcloud » en anglais est un outil de visualisation qui permet au travers d’une image de percevoir très rapidement quels sont les mots qui sont les plus fréquents au sein d’un texte ou un corpus de texte. Dans cet article nous allons voir son utilité.
Quel est l’utilité de créer un wordcloud ?
Le principe du nuage de mots est celui-ci : Au sein d’un texte, on calcule la fréquence des mots qui le compose. Plus un mot apparaît souvent, plus il sera mis en évidence !
Il existe trois leviers principaux pour la personnalisation du nuage de mots : sa taille, sa couleur ainsi que sa forme.
L’avantage principal du nuage de mots réside dans son aspect intuitif et esthétique : en un rien de temps, on comprend quels sont les mots sur lesquels il faut que l’on concentre. Les couleurs choisies peuvent aussi rendre la visualisation d’autant plus percutante avec l’utilisation de dégradés de couleurs par exemple.
Leur forme peut être personnalisée avec des images, que l’on appelle des « masks ».
A titre d’exemple, si l’on analyse une série de tweets sur le président Donald Trump on pourra donner une forme à notre nuage de mots qui reprendra celle de son visage, ce qui est également porteur d’information.
En bref, le nuage de mots permet de condenser un grand nombre d’informations en un minimum de visualisations ce qui est souvent ce que l’on recherche lorsque l’on fait des analyses textuelles.
Quels sont ses inconvénients ?
Bien que très pratique, le nuage de mots n’est pas toujours l’outil le plus pertinent et donc le plus efficace pour réaliser ses analyses textuelles. Il est moins précis qu’un bar chart qui donne des indications plus spécifiques sur la fréquence des mots et qui permet une comparaison efficace de la fréquence de l’apparition des mots du texte. Il comporte ainsi peu de précision dans l’information qu’il transmet. Également, il ne sera pas simple de traduire le contexte dans lequel ces mots apparaissent. Par exemple, il sera difficile d’interpréter des phrases avec une négation. La locution « Pas satisfait » ne va pas forcément être retranscrite comme ceci puisqu’il va analyser la fréquence de mots de façon individuelle.
Wordcloud & sentiment analysis
Son utilisation est néanmoins souvent pertinente dans le cadre d’une analyse de sentiment. Prenons un exemple d’étude de cas marketing.
Il pourrait être intéressant pour une équipe service client de visualiser alternativement quels sont les mots qui reviennent le plus au sein des commentaires positifs et négatifs sur des produits commercialisés.
Cela permet à la fois de mieux communiquer et de répondre de façon plus optimale aux différentes requêtes.
Après avoir réalisé une analyse de sentiments sur les commentaires qu’ils ont à leur disposition, le nuage de mots va venir appuyer cette première analyse en permettant aux équipes de voir quels sont les mots qui sont revenus majoritairement et qui ont conduit à leur classification.
A titre d’exemple, si les équipes client remarquent que les mots les plus présents dans les commentaires négatifs ont un lien fort avec le service de livraisons : « délais »,« frais »,« port ». Cela va orienter de façon très simple le travail en aval et orienter la prise de décision comme par exemple décider de réduire les frais de port ou encore changer de transporteur. A l’aide des nuages de mots, ces équipes vont pouvoir facilement justifier leurs choix auprès des autres équipes sans travail additionnel.
Dans un prochain article, vous verrez comment créer des wordcloud sur python, un peu de patience 😉
D’ici là vous pouvez toujours retrouver notre précédent article sur le sujet.