Altair ist der hellste Stern im Sternbild Adler. Aber Altair ist auch eine Bibliothek zur statistischen Visualisierung, die mit einer visuellen Grammatik arbeitet. Erfahre in diesem Artikel, wie sie verwendet wird und warum sie so beliebt ist...
Was ist Altair?
Altair ist eine Open-Source-Bibliothek für deklarative Grammatik zur statistischen Visualisierung namens Altaïr oder Vega-Altaïr.
Sie reduziert die Menge an Code, die du brauchst, um Graphen zu erzeugen, die professioneller aussehen, eine natürlichere Syntax haben und grafisch besser dargestellt und pixelig sind als Seaborn oder Maplotlib mit Bildern in der Größenordnung von 100000 Punkten.
Diese beiden Bibliotheken sind die bekanntesten im Bereich der Visualisierung mit einer sehr umfangreichen Dokumentation.
💡Auch interessant:
Imageio Python Bibliothek |
PySpark Python Bibliothek |
Folium Open Source Bibliothek von Python |
Top 10 Python Bibliotheken |
Wie installiere und verwende ich Altair ?
- Installiere es mit pip install altair.
- Importiere es mit altair as alt auf das Notebook.
Wie geht man mit der Grafikgrammatik um?
Eine Grafikgrammatik ist eine Syntax, die eine Visualisierung ohne Spezifikation erstellt und sie auf bestimmte Daten anwendet.
Als Beispiel werden wir mit einem Dataset von Babynamen in den USA arbeiten:
Hier folgt auf alt die Bibliothek des Diagramms, Chart, dann die Erklärung der verwendeten Daten (DataFrame baby_names_final), der Diagrammtyp, mark_chart, ein einfaches Balkendiagramm, dann die Erklärung der Daten, wobei x die Namen und y die Anzahl der Babys ist, die mit diesem Namen geboren wurden, indem das Jahr 1980 ausgewählt wurde.
Die Verteilung bestimmter Vornamen im Laufe der Jahre :
Man sieht also, dass es auf der rechten Seite des Graphen einen Knopf mit drei Punkten gibt, mit dem man den Graphen direkt in verschiedenen Formen speichern kann. View Source und View Compiled Vega ermöglichen es, JSON-Dateien für den Graphen zu lesen und sie mit dem Vega Editor zu öffnen, der auf eine github.io-Konsole verweist, wie unten dargestellt:
Datenoperationen werden direkt auf dem Graphen durchgeführt. Mit den Funktionen transform_joinaggregate und transfrom_filter kannst du groupby und filter wie in Pandas machen. Es gibt noch weitere Funktionen dieser Art:
- transform_calculate(), mit der man eine neue Größe berechnen kann;
- transform_density(), die eine Dichte schätzt;
- transform_window(), die einen Teil der Daten auswählt;
- mark_area() entspricht dem Typ des einfachen gestapelten Graphen;
- alt.FieldOneOfPredicate deklariert die Auswahl der zu verwendenden Modi.
Im Folgenden kann man auch einen Boxplot erstellen, um den Verlauf des Cursors über die Boxen darzustellen. Hier stellt der Boxplot die Verteilung der unterschiedlichen Anzahl von Kindern nach Vornamen in Abhängigkeit von den Jahren dar (der Tooltip).
Man kann erkennen, dass sich eine Dialogbox mit den spezifischen Informationen zum Vornamen öffnet.
Zu den weiteren Funktionen gehören:
- Man kann Slider hinzufügen.
- Die Anzeige kann auf drei Ebenen verändert werden: die Kodierung (encode), die Markierung (mark_ gefolgt von einem Typ) und die komplette Anzeige .configure_()
- Die Verwendung von geografischen Koordinaten in GeoJSON
Altair kann seine Inhalte auch über URL-Links aus dem Internet beziehen, indem er alt.UrlData verwendet. Die Daten müssen in JSON vorliegen und bereits bearbeitet sein. Sie basiert auf den JavaScript-Bibliotheken d3j und Vega, die oft für Infografiken in der Internetpresse verwendet werden.
Fazit
Altaïr kann eine gute deklarative, benutzerfreundliche Alternative zu matplotlib oder seaborn sein, mit einem optimierten Graph-Framework und professionellen Werkzeugen, um statistische Daten mit einer besseren Darstellung und einer intuitiveren Grammatik als bei klassischen Bibliotheken zu visualisieren.
Visualisierungen sind für Data Analysts oder Data Scientists ein wesentlicher Bestandteil des Informationsaustauschs innerhalb eines Unternehmens bei internen oder Kundenpräsentationen.
Wenn du dich für die Berufe der Data Science ausbilden lassen möchtest, kannst du auf den Link DataScientest, unsere Ausbildungsorganisation für die Berufe von morgen, klicken.