Matplotlib ist eine Bibliothek, mit der Du animierte, statische oder interaktive Visualisierungen erstellen kannst – und das alles in Python! Diese Bibliothek ist einfach zu benutzen und bietet eine Vielfalt an Möglichkeiten, um die Grafiken anzupassen. In diesem Artikel wirst Du vier nützliche Funktionen dieser Bibliothek kennenlernen
Mit Matplotlib kannst Du Deine Grafiken optisch aufwerten, indem Du Titel und Beschriftungen hinzufügst und den Stil und die Farbe deiner Grafiken wählst. Du kannst auch die Größe der Grafiken beeinflussen und die Anordnung der Grafiken wählen, wenn du mehrere Grafiken in einer Grafik anzeigen willst.
Matplotlib verfügt auch über eine Funktion, mit der du Grafiken frei kommentieren und ein Bild im jpg-Format speichern kannst. Schließlich ist es möglich, eine Grafik mit einem digitalen Tattoo zu versehen, um Copyright-Informationen hinzuzufügen.
Jetzt sehen wir uns einige Beispiele für Grafiken an, die man mit Matplotlib erstellen kann, und die wenigen Zeilen Code, um sie zu zeichnen.
1.Funktionen zeichnen
Matplotlib ist in erster Linie eine Bibliothek, mit der man Funktionen zeichnen und ihre Kurven in Diagrammen darstellen kann. Wir können die Verläufe von trigonometrischen Funktionen wie Sinus und Cosinus erhalten, indem wir das Intervall angeben, in dem wir diese Funktionen beobachten wollen.
Hier ist ein Beispiel für einen Verlauf zwischen 0 und 6 für die Sinus- und Kosinusfunktion.
Die verwendete Funktion ist plot(), eine Grundfunktion von Matplotlib.
2. 2D-Grafiken erstellen
Eine weitere Funktion von Matplotlib ist die Erstellung von 2D-Diagrammen, was für Data Scientists bei der Visualisierung von Daten sehr nützlich ist. Es ist möglich, Histogramme, Kreisdiagramme, Schnurrbartdiagramme, Scatterplots, Stackplots (um Daten gestapelt darzustellen), usw. anzuzeigen.
Diese Diagramme können z. B. verwendet werden, um die Verteilung von Daten, ihre statistischen Indikatoren, ihre Trends über einen bestimmten Zeitraum bei zeitlichen Daten usw. anzuzeigen.
Die wichtigsten Funktionen sind
- hist()um ein Histogramm zu zeichnen.
- bar()um ein Balkendiagramm zu zeichnen.
- pie()um ein Tortendiagramm zu zeichnen.
- box()zum Zeichnen von Boxplots.
- scatter()um eine Punktwolke zu zeichnen.
- stackplot()um ein Diagramm mit gestapelten Bereichen zu zeichnen.
Diese beiden Grafiken sind vom Modul „Matplotlib – Balkendiagramme“ des Kurses Data Scientist und Data Analyst inspiriert.
Diese Grafik wurde vom Modul „Matplotlib – Punktwolken“ des Kurses Data Scientist und Data Analyst inspiriert.
3. 3D-Grafiken anzeigen
Es ist auch möglich, 3D-Grafiken mithilfe von Matplotlib zu erstellen. Dazu musst Du eine spezielle Matplotlib-Bibliothek namens mpl_toolkits.mplot3d (oft in Axes3D umbenannt) verwenden.
3D-Grafiken können bestimmte Visualisierungen erleichtern und einen Bericht angenehmer lesbar machen.
Im Allgemeinen werden folgende Funktionen verwendet: Axes3D.plot(), Axes3D.scatter, Axes3D.plot_wireframe(), Axes3D.plot_surface(), Axes3D.bar().
Hier ist ein Beispiel dafür, was man mit diesen Funktionen anzeigen kann. Das Beispiel stammt aus der offiziellen Dokumentation
4.Widgets erstellen
Die letzte Funktion von Matplotlib, die wir behandeln werden, ist das Erstellen von Widgets. Das sind interaktive Visualisierungen, auf die der Benutzer Einfluss nehmen kann. Für einen Datenwissenschaftler kann dies sehr nützlich sein, zum Beispiel um zu sehen, wie die Änderung eines Parameters eine Funktion oder ein Machine-Learning-Modell beeinflusst.
Alle Klassen, die für die Implementierung eines Widgets benötigt werden, befinden sich im Modul matplolib.widgets.
Die Erstellung eines Widgets erfordert die Erstellung von Objekten und Funktionen, die die Aktion eines Objekts auf ein anderes Objekt beschreiben.
Beispiele für solche Objekte sind ein Schieberegler (aus der Klasse Slider) oder eine Schaltfläche (aus der Klasse Button), die zum Beispiel ein ganzes Intervall von Werten abdecken können, die der Parameter einer Funktion annehmen würde. Je nach dem Wert dieses Parameters sieht der Nutzer also, wie sich der Graph der Funktion sofort ändert.
Dieses Widget stammt aus dem Modul „Einführung in Deep Learning mit Keras“ der Studiengänge Data Scientist und Data Analyst.
Durch Anpassen der Parameter w1 und w2 können wir die rot eingezeichnete Gerade anpassen, um die Grenze zu finden, die die grün eingefärbten Daten von den orange eingefärbten Daten trennt. Dies ist ein so genanntes lineares Klassifizierungsproblem: Wir trennen Daten mithilfe einer linearen Entscheidungsgrenze in zwei Kategorien.
Fazit
Während du mit Matplotlib verschiedene Visualisierungen erstellen und anzeigen kannst, gibt es auch andere Bibliotheken, mit denen Du ebenso schöne Visualisierungen erstellen kannst. Zu diesen Bibliotheken gehören Seaborn, Bokeh und Ggplot.
Die Visualisierung von Daten steht im Mittelpunkt aller Probleme, mit denen sich Data Scientists und Data Analysts befassen. Um zu lernen, wie man diese Techniken beherrscht, werden in unseren Kursen für Data Scientists und Data Analysts mehrere Module zu Matplotlib, Bokeh und Seaborn angeboten.
Ces données étant confidentielles, les chiffres affichés sur les différents graphiques ont été modifiés et ne représentent donc pas la réalité.