Les variables de données sont parfois tellement importantes que les ordinateurs sont incapables de les traiter efficacement. C’est à cet instant qu’intervient la quantification. Cette discipline transforme les données continues en données discrètes pour simplifier la mesure des métriques.
C’est quoi la quantification ?
Définition de la quantification
La quantification est une notion mathématique dont l’objectif est d’associer une valeur numérique à un objet d’étude. L’objectif est alors de quantifier tous types de données qualitatives, qu’il s’agisse de textes, d’images, de vidéos, etc.
Cette méthode repose sur :
- Le comptage : cela concerne l’objet d’étude ou l’événement à quantifier.
- La mesure : il s’agit d’assigner une valeur numérique à certains aspects de l’objet d’étude selon une règle de convention. Mais attention, la mesure ne vise pas directement l’objet. Par exemple, il n’est pas possible de mesurer des individus en tant que tels, mais plusieurs caractéristiques de ces individus, comme leur âge, leur poids, leur taille, etc.
Outre les données qualitatives, la quantification peut aussi être utilisée pour les données numériques quantitatives qui présentent trop de valeurs possibles. Là encore, l’objectif est de simplifier leur traitement par un ordinateur. Pour cela, il convient de convertir une information continue (qui présente une infinité de valeurs possibles) en une information discrète (ou un ensemble limité de valeurs).
Quel que soit le type de donnée quantifiée, cette méthode permet de comparer plus facilement les informations entre elles.
Champ d’application
La quantification s’applique à de nombreux domaines. Voici les principaux :
- Les mathématiques et la physique : par exemple, dans la mécanique quantique, l’énergie d’un électron dans un atome est quantifiée. Les informations continues sont transformées en informations discrètes. C’est-à-dire qu’elles ne peuvent prendre que certaines valeurs spécifiques.
- Le traitement du signal : lors de la numérisation d’un signal analogique, comme un son ou une image, la quantification vise à arrondir les valeurs mesurées à l’une des valeurs d’un ensemble fini. Cette étape est indispensable, car les ordinateurs ne peuvent traiter que des nombres discrets.
- Les sciences sociales : il s’agit de transformer des données qualitatives (non numériques) en données quantitatives (numériques). Notamment en attribuant des scores ou des indices à des comportements ou des réponses.
- Le machine learning : la quantification intervient à plusieurs niveaux du processus d’apprentissage automatique, notamment les données d’entrée et l’évaluation des métriques.
Quels sont les différents types de quantification ?
Il existe différents types de quantification. Voici les principaux.
- La quantification universelle : elle se traduit à travers les expressions de types “pour tout … “ ou “ quel que soit … “ et se matérialise par le symbole ∀. Par exemple, la formule ∀xP(x) signifie tout objet du domaine considéré possède la propriété P.
- La quantification existentielle : cette quantification se rapporte à l’expression “ il existe au moins un … “ et se matérialise par le symbole ∃. Ici, la formule ∃xP(x) signifie un objet au moins du domaine considéré possède la propriété P.
- La quantification en traitement du signal : l’objectif est d’assigner des valeurs d’un ensemble discret à un signal. Autrement dit, de déterminer la valeur la plus proche dans un ensemble d’arrivée Y à partir d’une valeur d’entrée d’un espace X. Ce type de quantification concerne la conversion analogique numérique, et notamment, la compression de signaux audio ou d’image.
Quels sont les metrics utilisés en Machine Learning ?
En machine learning, la quantification permet de simplifier la mesure des métriques. Voici quelques exemples :
- La discrétisation des variables : lorsque les données d’entrée sont continues, il peut être nécessaire de les transformer en informations discrètes, afin de simplifier leur traitement. Par exemple, pour les données de revenus, il est plus pertinent de les discrétiser en groupe de revenus (0 à 25 K € – 25 K à 50 K € – 50 à 100 K € – etc.).
- La classification : l’idée est d’attribuer une catégorie à différents ensembles de données (notamment à travers l’algorithme de clustering K-means). Par exemple, les commentaires des clients peuvent être classés en avis positif ou négatif.
- La régularisation : pour éviter la sur-optimisation de certains paramètres, il est possible d’utiliser la quantification. Cette méthode vise alors à forcer les modèles à adopter des valeurs discrètes prédéfinies.
Rejoignez DataScientest pour maîtriser le Machine Learning
Pour entraîner efficacement les modèles ML avec la quantification, les data scientist doivent maîtriser une multitude de concepts mathématiques. À ce titre, une formation est plus que nécessaire. C’est justement possible avec DataScientest. Nous vous proposons des formations complètes en bootcamp, en continu ou en alternance.