Zurück zu den Artikeln

Dtype Python: Erstelle strukturierte Tabellen

12. August 2023

Minuten Lesezeit

Data Science

Egal, ob es sich um ein IT-Projekt, eine Personal- oder Geschäftsdatei handelt, eine Tabelle hat selten nur einen einzigen Datentyp. Oft werden numerische und textuelle Daten miteinander vermischt, um mehr Kontext zu schaffen. Genau aus diesem Grund sind Dtype auf Python so nützlich.

Worum handelt es sich also? Was sind die verschiedenen Dtypen? Wofür werden sie verwendet? Und wie werden sie verwendet? Das werden wir uns in diesem Artikel ansehen.

💡Auch interessant:

Python

Wordcloud Python

Python oder R ?

Python für Dummies Teil 2

Python Schulung

Was ist Scala und wieso ist Python besser

Top der nativen Python Funktionen

Was ist ein Dtype?

Dtype entspricht den Datentypen der NumPy-Bibliothek (numerical Python). Dieses Werkzeug, das auf der Programmiersprache C basiert, erleichtert numerische Berechnungen mit Python. Insbesondere wird die Verwaltung von Zahlenarrays vereinfacht. Dies wird durch die Verwendung von dtype ermöglicht. Jedes Array hat verschiedene Datentypen.

Mit Dtype Python kann man beschreiben, wie die Werte kodiert sind und wie sie interpretiert werden sollen. Sie informieren dich über die folgenden Informationen:

Der Datentyp: Ganzzahl, reelle Zahl, Textdaten, Python-Objekt usw.
Die Datengröße: Die Daten werden in Bits codiert. D. h. der zugewiesene Speicher, um sie im Arbeitsspeicher zu speichern. Je nach verfügbarem Speicher werden Daten in den Formaten int16, uint32, complex64 usw. gespeichert.
Die Byte-Reihenfolge der Daten: Das Zeichen „<“ wird für die little endian-Kodierung angegeben, ansonsten das Zeichen „>“ für die big endian-Kodierung. Diese Zeichen werden am Anfang des Datentyps angegeben.
Bei strukturierten Daten: Du erhältst zusätzliche Informationen über die Felder der Struktur, den Datentyp für jedes Feld, den Teil des Speicherblocks, der von jedem Feld belegt wird, etc. Die Idee ist dann, eine Tabelle, die aus verschiedenen Variablen besteht, so genau wie möglich zu beschreiben.
Für Subnetze: Hier informieren dich die dtype über die Form und den Typ der Daten.

Was sind die dtype von Python?

Wenn man bei Python von dtype spricht, stammen diese Variablen in Wirklichkeit aus der NumPy-Bibliothek. Und auf dieser sind sie sogar noch vielfältiger.

Über Python

Die Programmiersprache Python bietet dir diese Datentypen:

String: Er wird verwendet, um Textdaten darzustellen. Hier wird der Text in Anführungszeichen geschrieben. Zum Beispiel „die dtypes von Python“.
Integer: Dieser Dtyp steht für ganze Zahlen, wie -1, -2, -3.
Float: Ähnlich dem vorherigen Datentyp, hier geht es vor allem darum, reelle Zahlen darzustellen. Also nicht nur ganze Zahlen, sondern auch Dezimalzahlen oder Brüche, wie z. B. 1.2, ⅖, 5.69, etc.
Booleen: Das sind einfach die Daten, die True oder False darstellen.
Komplex: Das sind komplexere Zahlen, z. B. 1.0 + 2.3j.

Hierbei handelt es sich um die dtype auf Python. Auf NumPy gibt es jedoch eine größere Vielfalt an Datentypen.

Mit der NumPy-Bibliothek

Bei NumPy sind die dtypen der Datentyp und die Größe der Daten. Hier ist eine Tabelle, die die verschiedenen möglichen Kombinationen zusammenfasst:

Datentyp	Beschreibung
Bool_	Dies sind Wahrheitswerte (wahr oder falsch)
byte	Vorzeichenbehaftete Ganzzahl (positive oder negative Werte)
ubyte	Vorzeichenlose Ganzzahl (nur positive Werte)
int8	Vorzeichenbehaftete Ganzzahl auf 8 Bits.
int16	Vorzeichenbehaftete Ganzzahl auf 16 Bits.
int32	Vorzeichenbehaftete Ganzzahl auf 32 Bits.
int64	Vorzeichenbehaftete Ganzzahl auf 64 Bits.
uint8	Vorzeichenlose Ganzzahl auf 8 Bits.
uint16	Vorzeichenlose Ganzzahl auf 16 Bits.
uint32	Vorzeichenlose Ganzzahl auf 32 Bits.
uint64	Vorzeichenlose Ganzzahl auf 64 Bits.
float16	Gleitkommazahl auf 16 Bits.
float32	Gleitkommazahl auf 32 Bits.
float64	Gleitkommazahl auf 64 Bits.
complex64	Komplexe Zahl auf 64 Bits.
complex128	Komplexe Zahl auf 128 Bits.

Wozu dienen dtype bei Python?

Mit den Dtypen von Python können strukturierte Tabellen (oder Datensatztabellen) erstellt werden. Innerhalb dieser strukturierten Arrays kannst du pro Spalte verschiedene Datentypen einfügen. Zum Beispiel Zahlen, Textdaten, komplexe Formeln und so weiter.

Diese ähneln stark den traditionellen Excel– oder CSV-Dateien. Sie können von verschiedenen Abteilungen einer Organisation verwendet werden, z. B. von der Personalabteilung, um die Daten aller Mitarbeiter des Unternehmens zusammenzustellen, von der Logistikabteilung, um einen Überblick über die Lieferanten und ihre Preise zu erhalten usw.

Ohne dtype ist es nicht möglich, strukturierte Tabellen zu erstellen. Nur ndarray, die homogene Datenobjekte enthalten.

Wie erstellt man ein Array mit dtype?

Hier sind einige grundlegende Beispiele für die Erstellung von Arrays mit dtype in Python.

Ein Array mit nur einem Datentyp

Dafür gibt es zwei Möglichkeiten. 1 / Du kannst den Datentyp mithilfe einer Zeichenkette definieren. Hier ist der Code:

import numpy as np

a1 = np.array( [1,2,3], dtype = ‚int64‘)

print( a1)

2 / Du kannst den Datentyp durch Verweis auf die NumPy-Bibliothek definieren. Dies ist der Code:

a2 = np.array( [1,2,3], dtype = np.int64)

print(a2)

In diesen Beispielen haben wir Daten verwendet, die ganze Zahlen repräsentieren, aber es ist natürlich möglich, jeden anderen gewünschten Dtype zu verwenden.

Eine Tabelle mit verschiedenen Datenarten

Es ist möglich, eine strukturierte Tabelle mit mehreren Spalten zu erstellen, wobei jede Spalte einen eigenen Datentyp hat. Zum besseren Verständnis hier ein Beispiel mit drei Spalten:

Ein Feld „Name“ mit Textdaten (string).
Ein Feld „Alter“ mit ganzen Zahlen (integer).
Ein Feld „Gehalt“ mit Dezimalzahlen (float)

Hier ist der Code:

angestellter = np.dtype([(’name‘, ‚S‘), (‚alter‘, ‚i‘), (‚gehalt‘, ‚f‘)])

a = np.array([(‚vincent dupont‘, 32, 2368.45), (‚emilie martin‘, 26, 2689.23)]),

dtype = angestellt)

print(a)

print(a.dtype)

Dies sind nur einige vereinfachte Beispiele für dtype Python. Wenn du tiefer gehen willst, ist es besser, sich weiterzubilden.

Lerne Dtype Python mit DataScientest

Um Dtype auf Python zu beherrschen, bedarf es umfangreicher Kenntnisse und Praxis. Aus diesem Grund bietet Datascientest seine Schulungen in Datenanalyse und Datenwissenschaft an. Hier lernst du alles, was du über Programmiersprachen wissen musst.

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Weiterlesen

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!

Data Analyst

Analytics Engineer

Data Scientist

AI / Machine Learning Engineer

Data Engineer

Cloud Engineer

DevOps Engineer

Data Marketing & AI

MLOps

ETL Entwickler

Data Ops Engineer

Amazon Web Service (AWS)

Microsoft Power BI

Über uns

Karriere

Events

Unsere Alumni

Überblick

Bildungsgutschein

Qualifizierungs-chancengesetz

Zurück zu den Artikeln

Dtype Python: Erstelle strukturierte Tabellen