Que ce soit pour un projet informatique, un fichier RH ou commercial, un tableau possède rarement un seul type de données. Bien souvent, les données numériques et textuelles se confondent pour apporter plus de contexte. C’est justement pour cela que les Dtype sur Python sont si utiles.
Alors de quoi s’agit-il ? Quels sont les différents Dtype ? À quoi servent-ils ? Et comment les utiliser ? C’est ce que nous allons voir dans cet article.
C’est quoi un Dtype ?
- Le type de données : nombre entier, réel, données textuelles, objet Python, etc.
- La taille des données : les données sont codées en bits. C’est-à-dire, la mémoire allouée pour les stocker en mémoire. En fonction de la mémoire disponible, les datas se présenteront sous la forme int16, uint32, complex64, etc.
- L’ordre des octets des données : le signe « < » est indiqué pour l’encodage little endian, et sinon, c’est le signe « > » pour l’encodage big endian. Ces caractères sont précisés au début du type de donnée.
- Pour les données structurées : vous aurez des informations supplémentaires concernant les champs de la structure, le type de données pour chaque champ, la partie du bloc mémoire occupé par chaque champ, etc. L’idée est alors de décrire le plus précisément possible un tableau composé de différentes variables.
- Pour les sous-réseaux : ici, les dtype vous renseignent sur la forme et le type de données.
Quels sont les dtype de Python ?
Si l’on parle de dtype sur Python, ces variables proviennent en réalité de la bibliothèque NumPy. Et sur cette dernière, ils sont encore plus variés.
Sur Python
- String : il est utilisé pour représenter des données textuelles. Ici, le texte est écrit entre guillemets. Par exemple « les dtypes de Python »
- Integer : ce dtype représente les nombres entiers, comme -1, -2, -3.
- Float : similaire au type de données précédent, il s’agit surtout de représenter des nombres réels. Donc pas seulement les nombres entiers, mais aussi les décimales ou les fractions, telles que 1.2, ⅖, 5.69, etc.
- Booleen : il s’agit simplement des données représentant Vrai ou Faux.
- Complexe : ce sont les nombres plus complexes, comme 1.0 + 2.3j.
Il s’agit ici des dtype sur Python. Mais sur NumPy, il y a une plus grande variété de types de données.
Avec la bibliothèque NumPy
Sur NumPy, les dtype reprennent le type de données et leur taille. Voici un tableau récapitulant les différentes combinaisons possibles :
Type de données | Description |
---|---|
Bool_ | Ce sont les données vrai ou faux |
byte | Entier signé (valeur positive ou négative) |
ubyte | Entier non signé (c’est-à-dire uniquement des valeurs positives) |
int8 | Entier signé sur 8 bits. |
int16 | Entier signé sur 16 bits. |
int32 | Entier signé sur 32 bits. |
int64 | Entier signé sur 64 bits. |
uint8 | Entier non signé sur 8 bits. |
uint16 | Entier non signé sur 16 bits. |
uint32 | Entier non signé sur 32 bits. |
uint64 | Entier non signé sur 64 bits. |
float16 | Nombre à virgule sur 16 bits. |
float32 | Nombre à virgule sur 32 bits. |
float64 | Nombre à virgule sur 64 bits. |
complex64 | Nombre complexe sur 64 bits. |
complex128 | Nombre complexe sur 128 bits. |
À quoi servent les dtype sur Python ?
Les dtype de Python permettent de créer des tableaux structurés (ou tableaux d’enregistrements). À l’intérieur de ces tableaux structurés, vous pouvez insérer différents types de données par colonne. Par exemple, des données chiffrées, des données textuelles, des formules complexes, etc. Ces derniers ressemblent fortement aux traditionnels fichiers Excel ou CSV. Ils peuvent être utilisés par différents services de l’organisation, comme les ressources humaines pour compiler les données de tous les collaborateurs de l’entreprise, les services logistiques pour avoir une visibilité des fournisseurs et de leurs tarifs, etc.
Sans dtype, il n’est pas possible de créer des tableaux structurés. Seulement des ndarray qui contiennent des objets de données homogènes.
Comment créer un tableau avec dtype ?
Voici quelques exemples basiques de création de tableaux avec dtype sur Python.
Un tableau avec un seul type de donnée
Pour cela, deux possibilités s’offrent à vous.
1 / Soit définir le type de données en utilisant une chaîne de caractères.
Voici le code :
import numpy as np
a1 = np.array( [1,2,3], dtype = ‘int64’)
print( a1)
2 / Soit définir le type de données en faisant référence à la bibliothèque NumPy.
Voici le code :
a2 = np.array( [1,2,3], dtype = np.int64)
print(a2)
Dans ces exemples, nous avons utilisé les données représentant des nombres entiers, mais il est évidemment possible d’utiliser tout autre dtype souhaité.
Un tableau avec plusieurs types de donnée
Il est possible de créer un tableau structuré avec plusieurs colonnes, chacune ayant un type de donnée distinct. Pour vous aider à mieux comprendre, voici un exemple avec 3 colonnes :
- Un champ « nom » avec des données textuelles (string)
- Un champ « âge » avec des nombres entiers (integer)
- Un champ « salaire » avec des décimales (flottant)
Voici le code :
employé = np.dtype([(‘nom’,’S’), (‘age’, ‘i’), (‘salaire’, ‘f’)])
a = np.array([(‘vincent dupont’, 32, 2368.45), (’emilie martin’, 26, 2689.23)],
dtype = employé)
print(a)
print(a.dtype)
Il ne s’agit là que de quelques exemples simplifiés des dtype sur Python. Si vous souhaitez aller plus loin, mieux vaut se former.