Dtype Python : Comment créer des tableaux structurés ?

-
4
 m de lecture
-

Que ce soit pour un projet informatique, un fichier RH ou commercial, un tableau possède rarement un seul type de données. Bien souvent, les données numériques et textuelles se confondent pour apporter plus de contexte. C’est justement pour cela que les Dtype sur Python sont si utiles.

Alors de quoi s’agit-il ? Quels sont les différents Dtype ? À quoi servent-ils ? Et comment les utiliser ? C’est ce que nous allons voir dans cet article.

C’est quoi un Dtype ?

Les Dtype correspondent aux types de données de la bibliothèque NumPy (numerical Python). Cet outil construit à base de langage de programmation C facilite les calculs numériques avec Python. Notamment grâce à une gestion facilitée des tableaux (array) de nombres. Et cela est rendu possible grâce aux dtype. Et pour cause, chaque tableau possède différents types de données. Les dtype permettent ainsi de décrire comment sont codées les valeurs, et comment elles doivent être interprétées. Concrètement, ils vous renseignent sur les informations ci-dessous : 
  • Le type de données : nombre entier, réel, données textuelles, objet Python, etc.
  • La taille des données : les données sont codées en bits. C’est-à-dire, la mémoire allouée pour les stocker en mémoire. En fonction de la mémoire disponible, les datas se présenteront sous la forme int16, uint32, complex64, etc. 
  • L’ordre des octets des données :  le signe « < » est indiqué pour l’encodage little endian, et sinon, c’est le signe « > » pour l’encodage big endian. Ces caractères sont précisés au début du type de donnée. 
  • Pour les données structurées : vous aurez des informations supplémentaires concernant les champs de la structure, le type de données pour chaque champ, la partie du bloc mémoire occupé par chaque champ, etc. L’idée est alors de décrire le plus précisément possible un tableau composé de différentes variables.
  • Pour les sous-réseaux : ici, les dtype vous renseignent sur la forme et le type de données.

Quels sont les dtype de Python ?

Si l’on parle de dtype sur Python, ces variables proviennent en réalité de la bibliothèque NumPy. Et sur cette dernière, ils sont encore plus variés.

Sur Python

Le langage de programmation Python vous propose ces types de données :
  • String : il est utilisé pour représenter des données textuelles. Ici, le texte est écrit entre guillemets. Par exemple « les dtypes de Python »
  • Integer : ce dtype représente les nombres entiers, comme -1, -2, -3. 
  • Float : similaire au type de données précédent, il s’agit surtout de représenter des nombres réels. Donc pas seulement les nombres entiers, mais aussi les décimales ou les fractions, telles que 1.2, ⅖, 5.69, etc. 
  • Booleen : il s’agit simplement des données représentant Vrai ou Faux.
  • Complexe : ce sont les nombres plus complexes, comme 1.0 + 2.3j.

Il s’agit ici des dtype sur Python. Mais sur NumPy, il y a une plus grande variété de types de données.

Avec la bibliothèque NumPy

Sur NumPy, les dtype reprennent le type de données et leur taille. Voici un tableau récapitulant les différentes combinaisons possibles :

Type de données Description
Bool_ Ce sont les données vrai ou faux
byte Entier signé (valeur positive ou négative)
ubyte Entier non signé (c’est-à-dire uniquement des valeurs positives)
int8 Entier signé sur 8 bits.
int16 Entier signé sur 16 bits.
int32 Entier signé sur 32 bits.
int64 Entier signé sur 64 bits.
uint8 Entier non signé sur 8 bits.
uint16 Entier non signé sur 16 bits.
uint32 Entier non signé sur 32 bits.
uint64 Entier non signé sur 64 bits.
float16 Nombre à virgule sur 16 bits.
float32 Nombre à virgule sur 32 bits.
float64 Nombre à virgule sur 64 bits.
complex64 Nombre complexe sur 64 bits.
complex128 Nombre complexe sur 128 bits.

À quoi servent les dtype sur Python ?

Les dtype de Python permettent de créer des tableaux structurés (ou tableaux d’enregistrements). À l’intérieur de ces tableaux structurés, vous pouvez insérer différents types de données par colonne. Par exemple, des données chiffrées, des données textuelles, des formules complexes, etc. Ces derniers ressemblent fortement aux traditionnels fichiers Excel ou CSV. Ils peuvent être utilisés par différents services de l’organisation, comme les ressources humaines pour compiler les données de tous les collaborateurs de l’entreprise, les services logistiques pour avoir une visibilité des fournisseurs et de leurs tarifs, etc. 

Sans dtype, il n’est pas possible de créer des tableaux structurés. Seulement des ndarray qui contiennent des objets de données homogènes.

Comment créer un tableau avec dtype ?

Voici quelques exemples basiques de création de tableaux avec dtype sur Python.

Un tableau avec un seul type de donnée

Pour cela, deux possibilités s’offrent à vous. 

1 / Soit définir le type de données en utilisant une chaîne de caractères. 

Voici le code : 

import numpy as np

a1 = np.array( [1,2,3], dtype = ‘int64’)

print( a1)

2 / Soit définir le type de données en faisant référence à la bibliothèque NumPy. 

Voici le code : 

a2 = np.array( [1,2,3], dtype = np.int64)

print(a2)

Dans ces exemples, nous avons utilisé les données représentant des nombres entiers, mais il est évidemment possible d’utiliser tout autre dtype souhaité.

Un tableau avec plusieurs types de donnée

Il est possible de créer un tableau structuré avec plusieurs colonnes, chacune ayant un type de donnée distinct. Pour vous aider à mieux comprendre, voici un exemple avec 3 colonnes : 

  • Un champ « nom » avec des données textuelles (string)
  • Un champ « âge » avec des nombres entiers (integer)
  • Un champ « salaire » avec des décimales (flottant)

Voici le code : 

employé = np.dtype([(‘nom’,’S’), (‘age’, ‘i’), (‘salaire’, ‘f’)])

a = np.array([(‘vincent dupont’, 32, 2368.45), (’emilie martin’, 26, 2689.23)],

dtype = employé)

print(a)

print(a.dtype)

Il ne s’agit là que de quelques exemples simplifiés des dtype sur Python. Si vous souhaitez aller plus loin, mieux vaut se former.

Rejoignez DataScientest pour maîtriser les dtype sur Python

La maîtrise des Dtype sur Python nécessite des connaissances et une pratique approfondies. C’est pourquoi, Datascientest vous propose ses formations en analyse et science de la donnée. Ici, vous apprendrez tout ce qu’il faut savoir sur les langages de programmation.
Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?