Du hast Fragen? Wir haben Antworten! - Bald findet unser nächster Tag der offenen Tür statt!

Logo site

Dtype Python: Erstelle strukturierte Tabellen

-
4
 Minuten Lesezeit
-
dtype python

Egal, ob es sich um ein IT-Projekt, eine Personal- oder Geschäftsdatei handelt, eine Tabelle hat selten nur einen einzigen Datentyp. Oft werden numerische und textuelle Daten miteinander vermischt, um mehr Kontext zu schaffen. Genau aus diesem Grund sind Dtype auf Python so nützlich.

Worum handelt es sich also? Was sind die verschiedenen Dtypen? Wofür werden sie verwendet? Und wie werden sie verwendet? Das werden wir uns in diesem Artikel ansehen.

 

💡Auch interessant:

Python
Wordcloud Python
Python oder R ?
Python für Dummies Teil 2
Python Schulung
Was ist Scala und wieso ist Python besser
Top der nativen Python Funktionen

Was ist ein Dtype?

Dtype entspricht den Datentypen der NumPy-Bibliothek (numerical Python). Dieses Werkzeug, das auf der Programmiersprache C basiert, erleichtert numerische Berechnungen mit Python. Insbesondere wird die Verwaltung von Zahlenarrays vereinfacht. Dies wird durch die Verwendung von dtype ermöglicht. Jedes Array hat verschiedene Datentypen.

Mit Dtype Python kann man beschreiben, wie die Werte kodiert sind und wie sie interpretiert werden sollen. Sie informieren dich über die folgenden Informationen:

  • Der Datentyp: Ganzzahl, reelle Zahl, Textdaten, Python-Objekt usw.
  • Die Datengröße: Die Daten werden in Bits codiert. D. h. der zugewiesene Speicher, um sie im Arbeitsspeicher zu speichern. Je nach verfügbarem Speicher werden Daten in den Formaten int16, uint32, complex64 usw. gespeichert.
  • Die Byte-Reihenfolge der Daten: Das Zeichen „<“ wird für die little endian-Kodierung angegeben, ansonsten das Zeichen „>“ für die big endian-Kodierung. Diese Zeichen werden am Anfang des Datentyps angegeben.
  • Bei strukturierten Daten: Du erhältst zusätzliche Informationen über die Felder der Struktur, den Datentyp für jedes Feld, den Teil des Speicherblocks, der von jedem Feld belegt wird, etc. Die Idee ist dann, eine Tabelle, die aus verschiedenen Variablen besteht, so genau wie möglich zu beschreiben.
  • Für Subnetze: Hier informieren dich die dtype über die Form und den Typ der Daten.

Was sind die dtype von Python?

Wenn man bei Python von dtype spricht, stammen diese Variablen in Wirklichkeit aus der NumPy-Bibliothek. Und auf dieser sind sie sogar noch vielfältiger.

Über Python

Die Programmiersprache Python bietet dir diese Datentypen:

  • String: Er wird verwendet, um Textdaten darzustellen. Hier wird der Text in Anführungszeichen geschrieben. Zum Beispiel „die dtypes von Python“.
  • Integer: Dieser Dtyp steht für ganze Zahlen, wie -1, -2, -3.
  • Float: Ähnlich dem vorherigen Datentyp, hier geht es vor allem darum, reelle Zahlen darzustellen. Also nicht nur ganze Zahlen, sondern auch Dezimalzahlen oder Brüche, wie z. B. 1.2, ⅖, 5.69, etc.
  • Booleen: Das sind einfach die Daten, die True oder False darstellen.
  • Komplex: Das sind komplexere Zahlen, z. B. 1.0 + 2.3j.

Hierbei handelt es sich um die dtype auf Python. Auf NumPy gibt es jedoch eine größere Vielfalt an Datentypen.

Mit der NumPy-Bibliothek

Bei NumPy sind die dtypen der Datentyp und die Größe der Daten. Hier ist eine Tabelle, die die verschiedenen möglichen Kombinationen zusammenfasst:

Datentyp Beschreibung
Bool_ Dies sind Wahrheitswerte (wahr oder falsch)
byte Vorzeichenbehaftete Ganzzahl (positive oder negative Werte)
ubyte Vorzeichenlose Ganzzahl (nur positive Werte)
int8 Vorzeichenbehaftete Ganzzahl auf 8 Bits.
int16 Vorzeichenbehaftete Ganzzahl auf 16 Bits.
int32 Vorzeichenbehaftete Ganzzahl auf 32 Bits.
int64 Vorzeichenbehaftete Ganzzahl auf 64 Bits.
uint8 Vorzeichenlose Ganzzahl auf 8 Bits.
uint16 Vorzeichenlose Ganzzahl auf 16 Bits.
uint32 Vorzeichenlose Ganzzahl auf 32 Bits.
uint64 Vorzeichenlose Ganzzahl auf 64 Bits.
float16 Gleitkommazahl auf 16 Bits.
float32 Gleitkommazahl auf 32 Bits.
float64 Gleitkommazahl auf 64 Bits.
complex64 Komplexe Zahl auf 64 Bits.
complex128 Komplexe Zahl auf 128 Bits.

Wozu dienen dtype bei Python?

Mit den Dtypen von Python können strukturierte Tabellen (oder Datensatztabellen) erstellt werden. Innerhalb dieser strukturierten Arrays kannst du pro Spalte verschiedene Datentypen einfügen. Zum Beispiel Zahlen, Textdaten, komplexe Formeln und so weiter.

Diese ähneln stark den traditionellen Excel– oder CSV-Dateien. Sie können von verschiedenen Abteilungen einer Organisation verwendet werden, z. B. von der Personalabteilung, um die Daten aller Mitarbeiter des Unternehmens zusammenzustellen, von der Logistikabteilung, um einen Überblick über die Lieferanten und ihre Preise zu erhalten usw.

Ohne dtype ist es nicht möglich, strukturierte Tabellen zu erstellen. Nur ndarray, die homogene Datenobjekte enthalten.

Wie erstellt man ein Array mit dtype?

Hier sind einige grundlegende Beispiele für die Erstellung von Arrays mit dtype in Python.

Ein Array mit nur einem Datentyp

Dafür gibt es zwei Möglichkeiten. 1 / Du kannst den Datentyp mithilfe einer Zeichenkette definieren. Hier ist der Code:

import numpy as np

.

a1 = np.array( [1,2,3], dtype = ‚int64‘)

print( a1)

2 / Du kannst den Datentyp durch Verweis auf die NumPy-Bibliothek definieren. Dies ist der Code:

a2 = np.array( [1,2,3], dtype = np.int64)

print(a2)

In diesen Beispielen haben wir Daten verwendet, die ganze Zahlen repräsentieren, aber es ist natürlich möglich, jeden anderen gewünschten Dtype zu verwenden.

Eine Tabelle mit verschiedenen Datenarten

Es ist möglich, eine strukturierte Tabelle mit mehreren Spalten zu erstellen, wobei jede Spalte einen eigenen Datentyp hat. Zum besseren Verständnis hier ein Beispiel mit drei Spalten:

  • Ein Feld „Name“ mit Textdaten (string).
  • Ein Feld „Alter“ mit ganzen Zahlen (integer).
  • Ein Feld „Gehalt“ mit Dezimalzahlen (float)

Hier ist der Code:

angestellter = np.dtype([(’name‘, ‚S‘), (‚alter‘, ‚i‘), (‚gehalt‘, ‚f‘)])

a = np.array([(‚vincent dupont‘, 32, 2368.45), (‚emilie martin‘, 26, 2689.23)]),

dtype = angestellt)

print(a)

print(a.dtype)

Dies sind nur einige vereinfachte Beispiele für dtype Python. Wenn du tiefer gehen willst, ist es besser, sich weiterzubilden.

Lerne Dtype Python mit DataScientest

Um Dtype auf Python zu beherrschen, bedarf es umfangreicher Kenntnisse und Praxis. Aus diesem Grund bietet Datascientest seine Schulungen in Datenanalyse und Datenwissenschaft an. Hier lernst du alles, was du über Programmiersprachen wissen musst.

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!
icon newsletter

DataNews

Starte Deine Karriere im Bereich Data: Erhalte regelmäßig Insiderwissen und wertvolle Karrieretipps in Deinem Posteingang.