apprentissage automatique

Apprentissage automatique

Tracy Sadoun

Tracy Sadoun

3 min

L’apprentissage automatique ou machine learning réside dans le fait de rassembler une large quantité d’exemples afin de déterminer les schémas sous-jacents pour ensuite les utiliser afin d’effectuer des pronostics concernant de nouveaux exemples.

A titre d’exemple, si une grande sélection d’individus nous fournissent le nom de leur film préféré,  alors l’ordinateur sera capable de trouver les points communs entre tous ces films. L’ordinateur va dès lors énoncer des propositions  en expliquant le chemin qu’il a suivi pour en arriver à ces conclusions. Par exemple : “ceux qui apprécient les films romantiques en général n’aiment pas ceux d’horreur. Par contre, il adoreront les films dans lesquels les mêmes acteurs jouent

Autrement dit, l’apprentissage automatique est une forme d’intelligence artificielle basée sur des concepts mathématique et statistique qui permet à l’ordinateur d’apprendre à partir des données est non à l’aide d’une programmation explicite.

L’apprentissage automatique, en anglais machine Learning,  est aussi nommé apprentissage machine ou apprentissage artificielle. Des techniques d’apprentissage automatique sont essentielles pour que les pronostics de la machine soient les plus justes possibles. En effet, il y a de nombreuses approches qui changent selon la catégorie et la quantité de données

Comment fonctionne l’apprentissage automatique?

En générale, l’apprentissage automatique se compose de 2 phases :

  • Le première phase est la conception de système qu’on appelle aussi phase d’apprentissage ou d’entraînement est l’estimation d’un modèle à partir de l’analyse des données. Cela comprend une estimation d’une densité de probabilité ou la résolution d’une tâche pratique comme la traduction d’un discours.
  • La seconde phase est une mise en production. Il est possible que des systèmes continuent leur apprentissage même en étant déjà en production. Après la détermination du modèle, on teste la seconde partie de données utile pour la réalisation de la tâche désirée.

La reconnaissance visuelle est l’exemple le plus commun d’application du machine Learning. Par exemple, la reconnaissance d’un animal dans une photographie, la détection de fraude bancaire ou encore un véhicule autonome de Google.

La reconnaissance visuelle est l’exemple le plus commun d’application du machine Learning. Par exemple, la reconnaissance d’un animal dans une photographie, la détection de fraude bancaire ou encore un véhicule autonome de Google.   

En fonction des informations à disposition durant la phase d’apprentissage, l’apprentissage est qualifié distinctement. Si les données sont étiquetées, on parle d’apprentissage supervisé. Dans le cas où les données ne sont pas étiquetées, il s’agit alors d’apprentissage non supervisé. L’apprentissage automatique peut être utilisée avec de nombreux types de données : des graphes, des courbes, ou des vecteurs de caractéristiques par exemple

En apprentissage supervisé, l’algorithme d’apprentissage automatique trouve son fonctionnement dans le fait que la machine possède dès le lancement de son apprentissage des données en entrée et en sortie déjà définies. Ainsi, l’algorithme sera en capacité d’étudier ces exemples, de les comprendre et d’ainsi élaborer un modèle de prédictions capable ensuite de traiter les nouvelles données. 

Pour créer ces modèles de prédictions, l’apprentissage supervisé va utiliser la classification. La classification induit qu’on puisse identifier et catégoriser l’ensemble des données fournies selon leurs caractéristiques. Ainsi, la classification est notamment utilisée dans le digital, le médical et la banque. Un exemple de classification le plus commun est la classification automatique entre les mails pour séparer les mails de sources intéressantes de ceux considérés comme des spams 

A titre d’exemple, l’apprentissage supervisé est aussi très souvent utilisé dans les techniques de régression. Cette technique permet de prédire des variables continues :

Grâce à l’apprentissage supervisé d’un modèle de données la machine peut prédire les différentes variations de données comme les changements de température par exemple

A l’inverse de l’apprentissage supervisé, celui non supervisé possède de nombreuses données d’entrées mais aucune données de sortie : les réponses ne sont pas déterminées. Parmi l’apprentissage non supervisé, on retrouve la technique de clustering.

 

L’apprentissage automatique chez DataScientest

DataScientest porte une importance considérable à l’apprentissage automatique et le place parmi l’un des modules à valider aux cours de ses formations. Notamment, dans la formation à la Data Analyst et Data Scientist, un module de 75h sera dédié au Machine Learning. De même, au sein de la formation Data Engineer et dans le module de Big Data de 80h, il vous sera demandé d’apprendre à entraîner des algorithmes de Machine Learning sur un cluster de machines avec Pyspark.  Enfin, dans la formation Data Manager, le module de Data Literacy demandera, pour être validé, que l’apprenant soit capable de savoir choisir quelle méthode de Machine Learning choisir en fonction du métier concerné.