🚀 Bist Du bereit für eine Karriere im Bereich Data? Finde es in nur 60 Sekunden heraus!

Treemap: Definition, Anwendung und Grenzen

-
3
 Minuten Lesezeit
-
treemap

Treemap: Die Datenvisualisierung ist für alle Datenanalysten ein unverzichtbarer Schritt: Sie liefert klare und verständliche Informationen, die leicht an ein beliebiges Publikum vermittelt werden können. Die Treemap ist ein wichtiges Werkzeug in der Datenvisualisierung und sollte von Data Scientists und Data Analysts beherrscht werden.

Die Treemap ist eine Darstellung von hierarchisch organisierten Daten in einem begrenzten Raum (sie kann aber auch auf nicht-hierarchische Daten angewendet werden). Auf den ersten Blick könnte die Treemap wie ein Schachbrett aussehen, auf dem jedes Feld eine variable Größe hat und in dem Gruppen (oder Cluster) von Feldern mit ähnlichen Farben unterschieden werden.

Diese Darstellung macht es einfach, die Felder innerhalb jeder Gruppe, die Felder über die Gruppen hinweg und die Gruppen untereinander zu vergleichen.

Wegen ihrer Einfachheit und Effektivität wird die Treemap in einer Vielzahl von Bereichen eingesetzt: Finanzen, Demografie, Industrieproduktion, Marketing usw.

Es kann z. B. sehr effektiv das relative Gewicht jeder Industrie in jeder Exportkette eines Landes darstellen oder die relative Größe der verschiedenen Vermögenswerte nach ihrer spezifischen Art in einem Finanzportfolio usw.

Wie ist Treemap entstanden?

Die Treemap entstand aus dem Einfallsreichtum von Ben Shneiderman, Professor für Computerwissenschaften an der Universität von Maryland und Gründer des Human-Computer Interaction Lab. Shneiderman war weder an den verschiedenen Exportsektoren seines Landes noch an einem Finanzportfolio interessiert.

Stattdessen wollte er einfach nur eine schnelle Lösung finden, mit der er alle Ordner, Verzeichnisse und Dateien auf der Harddisk darstellen konnte. Shneiderman musste also hierarchisch organisierte Daten (Ordner und Dateien in Ordnern) auf kleinstem Raum darstellen. Es war ihm klar, dass Diagramme, die eine hierarchische Struktur in einer Baumstruktur darstellen, den großen Nachteil haben, dass sie mit all den Knoten und ihren Zweigen schnell zu groß und unhandlich werden.

Shneiderman musste also eine Lösung finden, um eine hierarchische Baumstruktur in einem Rahmen mit Platzbeschränkungen darzustellen: Er erfand die Treemap. In einem einzigen rechteckigen Diagramm konnte er die gesamte hierarchische Organisation seiner Daten auf der Festplatte betrachten. Aufgrund ihrer Einfachheit und Klarheit ist die Treemap in der Welt der Datenvisualisierung berühmt geworden.

Ben Shneiderman

Treemap: Was sind die Vorteile ?

Die Treemap besteht aus einer Reihe von verschachtelten Rechtecken, deren Fläche proportional zu den Daten ist, die sie repräsentieren.

Die größeren Rechtecke stellen die Hauptzweige des Baums dar und sind in kleinere Rechtecke unterteilt, die den verschiedenen Knoten (oder Unterzweigen) jedes Zweigs entsprechen. Der numerische Wert der Daten entspricht der Fläche jedes Rechtecks. Diese Organisation stellt den Hauptvorteil der Treemap dar.

Dank dieser Organisation, die aus einer Rechteckstruktur auf kleinem Raum besteht, ermöglicht die Treemap einerseits einen sehr direkten und effizienten Vergleich von Mengen und andererseits die Herausarbeitung von Trends, die unsere Daten strukturieren.

So werden Rechtecke unterschiedlicher Größe und Farbe verwendet, um sowohl die verschiedenen Elemente der Datenbank und ihre Organisation darzustellen, als auch um Variablen und Modalitäten mit einem größeren Gewicht von solchen mit einem eher marginalen Gewicht zu unterscheiden.

Treemaps ermöglichen also die Darstellung von Rangfolgen, Unterschieden zwischen verschiedenen Teilen, relativen Anteilen usw..

Obwohl die Treemap-Organisation für die Visualisierung von hierarchisch organisierten Daten entwickelt wurde, kann sie auch nicht-hierarchische Daten verarbeiten. Wenn die Treemap nicht-hierarchische Daten verarbeitet, wird sie zu einer Alternative zum klassischen Tortendiagramm, das einen Teil und die Beziehung zum Ganzen darstellt.

Der große Unterschied und Vorteil der Treemap ist, dass sie im Gegensatz zum Tortendiagramm Dutzende (oder sogar Hunderte) von Elementen enthalten kann. In diesem Sinne kann die Treemap eine Alternative zum Balkendiagramm sein: Wenn unsere Daten aus einer großen Anzahl von Elementen bestehen, wäre es unmöglich, ein Balkendiagramm in einem Diagramm darzustellen. In einem solchen Fall können wir eine Treemap verwenden, die es uns ermöglicht, Dutzende von Modalitäten durch Dutzende von Rechtecken darzustellen.

# Erstelle eine Treemap, die DataScientest darstellt, mit der plotly-Bibliothek von Python.

Treemap Anwendungen und Grenzen

Heutzutage gibt es mehrere Algorithmen, die hierarchische Daten durch Treemaps darstellen können.

Zu nennen sind hier Squarified, Slice and Dice und Stripped: Diese Algorithmen sind extrem einfach und leicht zu implementieren. Insbesondere Squarified gehört wegen seiner Darstellungsqualitäten zu den am häufigsten verwendeten Algorithmen.

Er erzeugt nämlich möglichst quadratische Blöcke und ordnet sie absteigend nach ihrer Größe an. Dies erleichtert den Vergleich zwischen den Elementen.

Aufgrund ihrer Eigenschaften werden Treemaps häufig im Bereich der Business Intelligence (BI) eingesetzt. Sie bieten jedoch nur eine Darstellung der wichtigsten Trends in den Daten und ermöglichen keine genauen Vergleiche oder Analysen der Beziehungen zwischen den Variablen.

Ein Visualisierungswerkzeug wie die Treemap muss Teil der Kenntnisse sein, die ein Data Scientist und ein Data Analyst besitzen. Wenn du dich in Data Science ausbilden lässt, wirst du sicherlich lernen, diese Werkzeuge zu mobilisieren.

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!
icon newsletter

DataNews

Starte Deine Karriere im Bereich Data: Erhalte regelmäßig Insiderwissen und wertvolle Karrieretipps in Deinem Posteingang.