Altaïr : tout savoir sur cette bibliothèque de visualisation statistique

-
2
 m de lecture
-

Altaïr est l’étoile la plus brillante de la constellation de l’aigle. Mais Altaïr c'est aussi une bibliothèque de visualisation statistique qui fonctionne avec une grammaire visuelle. Découvrez dans cet article comment elle est utilisée et pourquoi elle est si prisée…

Qu’est-ce qu’Altaïr ?

C’est une bibliothèque open source de grammaire déclarative de visualisation statistique appelée Altaïr ou Véga-Altaïr qui réduit la quantité de code dont vous avez besoin pour générer des graphes qui ont un air plus professionnel, une syntaxe plus naturelle et qui sont graphiquement mieux présentés et pixelisés que Seaborn ou Maplotlib avec des images de l’ordre de 100000 points. Ces deux bibliothèques sont les plus connues en ce qui concerne la visualisation avec une documentation très riche.

Comment installer et utiliser Altaïr ?

  • On l’installe à l’aide de pip install altair
  • On l’importe sur le notebook grâce à altair as alt

Comment s’y prend-on avec la grammaire graphique ?

Une grammaire graphique, c’est une syntaxe qui crée une visualisation sans spécification et l’applique à des données particulières.

Pour exemple, on va travailler sur un dataset de noms de bébés au USA :

Ici, alt est suivi de la bibliothèque du graphique, Chart, puis par la déclaration des données utilisées (DataFrame baby_names_final), le type de graphique, mark_chart, un simple diagramme en bâton, puis par la déclaration des données, x étant les noms et y étant le nombre de bébés étant nés avec ce nom en sélectionnant l’année 1980.

La distribution de certains prénoms au cours des années :

Vega Editor Video

On constate donc que sur le côté droit du graphe, il y a un bouton de trois points qui permet de sauver directement le graphe sous différentes formes. View Source et View Compiled Vega permettent de lire des fichiers JSON pour le graphe et de les ouvrir avec Vega Editor qui renvoit vers une console github.io comme ci-dessous :

Les opérations sur les données sont faites directement sur le graphe. Les fonctions transform_joinaggregate et transfrom_filter permettent de faire des groupby et des filtres comme en pandas. Il y a d’autres fonctions de ce type :

  • transform_calculate() qui permet de calculer une nouvelle grandeur ;
  • transform_density() qui fait l’estimation d’une densité ;
  • transform_window() qui choisit une partie des données ;
  • mark_area() correspond au type de graphe empilé simple ;
  • alt.FieldOneOfPredicate déclare le choix des modes à utiliser.

Dans la suite, on peut aussi faire un boxplot pour présenter le passage du curseur sur les box. Ici, le boxplot représente la répartition des différentes nombres d’enfants par prénom en fonction des années (le Tooltip). On peut constater qu’il y a une boîte de dialogue qui s’ouvre avec les informations spécifiques au prénom.

Box plot video

Parmi les autres fonctionnalités :

  • On peut ajouter des sliders
  • On peut modifier l’affichage à trois niveaux: l’encodage (encode), la marque(mark_ suivi d’un type) et l’affichage complet .configure_()
  • L’usage des coordonnées géographiques en GeoJSON

Altaïr peut aussi sourcer son contenu sur internet grâce à des liens URL grâce à alt.UrlData. Les données doivent être en JSON et déjà travaillées. Elle est basée sur des bibliothèques JavaScript, d3j et Vega, qui sont souvent utilisées pour des infographies dans la presse internet.

Conclusion

Altaïr peut constituer une bonne alternative déclarative, simple d’utilisation et avec un framework de graphe optimisé, à matplotlib ou seaborn et utilise des outils professionnels pour visualiser des données statistiques avec un meilleur rendu et une grammaire plus intuitive que sur les bibliothèques classiques. Les visualisations sont des éléments essentiels au partage d’information pour les Data Analysts ou Data Scientists au sein de l’entreprise lors de présentations internes ou clients.

Si vous voulez vous former aux métiers de la Data Science, vous pouvez cliquer sur le lien DataScientest, notre organisme de formation aux métiers de demain.

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?