Réseaux de Neurones Artificiels : Qu’est-ce que c’est ?

-
3
 m de lecture
-

Les réseaux de neurones artificiels sont au cœur des progrès spectaculaires que l’intelligence artificielle a connu récemment.  Comment fonctionnent-ils et qu’est ce qui fait leur force ?

Le modèle mathématique des réseaux de neurones artificiels (RNA) a été initialement proposé en 1943 par deux chercheurs de l’Université de Chicago : Warren McCullough, et Walter Pitts. Dans un article du journal Brain Theory, ils ont énoncé une théorie articulée autour du neurone comme élément fondamental de l’activité de réaction à des événements externes.

Il a fallu attendre 1957 pour que soit développé le premier prototype exploitant les RNA : le Perceptron de Frank Rosenblatt. Celui-ci tentait d’accomplir des tâches de reconnaissance à partir d’un algorithme d’apprentissage répétitif. Toutefois, à l’époque, les ordinateurs n’étaient pas assez puissants pour traiter les volumes de données nécessaires à une évaluation pratique de situations du monde réel. C’est ce qu’ont constaté Marvin Minsky et Seymour Papert dans le livre Perceptrons (1969), où ils soulignaient les limitations des réseaux de neurones. La recherche va marquer une pause durant près de deux décennies.

Une première percée a eu lieu en 1986 lorsque David Rumelhart, Geoffrey Hinton et Ronald Williams ont publié un essai sur la rétropropagation progressive, une technique d’apprentissage qui relance l’intérêt pour les réseaux neuronaux.

Toutefois, il a fallu attendre l’essor du Big Data et des ordinateurs massivement parallèles pour que les réseaux de neurones disposent d’une capacité de traitement adéquate. En 2012, une étape a été franchie lorsque l’équipe d’Alex Krizhevsky a remporté la compétition ImageNet portant sur la reconnaissance d’image.

Qu'est-ce qu'un réseau de neurones artificiel ?

Un réseau de neurones artificiel apprend en analysant des exemples prédéfinis. Il s’entraîne à développer un modèle mathématique prédictif, par exemple la reconnaissance d’objets dans une image. Pour ce faire, un RNA s’appuie sur un grand nombre de processeurs organisés en couches et opérant en parallèle. Trois types de couches sont à considérer.

1. Couche d'entrée

Cette couche est celle qui réceptionne les informations brutes. Par comparaison, nous pouvons considérer que les nerfs optiques perçoivent une image avant de l’analyser.

2. Couches intermédiaires cachées

La donnée brute va transiter par plusieurs couches qui chacune va opérer une analyse partielle de l’information avant de la transmettre à la suivante.

3. Couche de sortie

La toute dernière couche produit le résultat final, soit l’information analysée.

Ajustement des couches

En réalité, ce processus peut être effectué plusieurs fois auquel cas le RNA suit une phase d’apprentissage au cours de laquelle il ajuste ses poids, soit l’importance de chacune des couches.

Inférences

Le réseau peut progressivement opérer des inférences soit des prédictions ou déductions applicables sur de nouvelles données.

Quels sont les types de réseaux de neurones ?

Réseaux feedfoward

Dans un tel RNA, l’information circule dans une seule direction, de l’entrée vers la sortie.

Réseaux récurrent (RNN)

Les RNN gèrent des couches récurrentes : ils “mémorisent » des informations des étapes précédentes. Cela les rend efficaces pour des tâches comme la reconnaissance vocale (ils peuvent identifier des mots en tenant compte des sons précédents), la traduction automatique ou l’analyse de texte (en établissant des relations entre les mots déjà analysés).

Réseaux antagonistes génératifs (GAN)

Ce modèle d’intelligence artificielle utilise deux réseaux de neurones en compétition pour générer des données réalistes.

Réseaux convolutifs (RCNN)

Ils sont principalement utilisés pour traiter des données structurées en grille, comme les images et sont donc très efficaces pour des applications comme la reconnaissance faciale.

Quelles applications concrètes ?

Les RNA sont à la base des immenses progrès récents de l’intelligence artificielle et nous les retrouvons au sein d’un très grand nombre d’applications.

Vision par ordinateur

Les algorithmes DeepFace de reconnaissance faciale de Facebook se sont avérés si efficaces (une précision de 97,35% en 2014) que Meta a jugé préférable d’en suspendre l’usage suite à diverses polémiques concernant la vie privée.

Art et créativité

Les IA génératives telles que Midjourney, Leonardo (images), mais aussi Suno (chansons), Gen 3 de Runway (vidéos), capables de réaliser des œuvres à partir de descriptions textuelles sont l’un des exemples les plus marquants de l’usage des RNA.

Traitement du langage naturel

Les assistants vocaux tels que Siri, Alexa, Google Assistant ou Cortana s’appuient sur des RNAs.

Jeux et prise de décision

En 2016, AlphaGo, un outil développé par DeepMind, une filiale de Google, a battu le champion du monde de Go, un jeu réputé pour sa complexité et l’étendue des combinaisons possibles, avec un score sans appel de 5 à 0. Un tel exploit semblait impossible dix ans plus tôt.

Finance

Le RNA mis en place par Paypal pour détecter des transactions frauduleuses a réduit le taux de fraude à 0,28 % en 2024.

Automobile

Un véhicule autonome tel que Waymo (également connue comme la Google Car) se sert de RNA (des CNN) pour l’analyse en temps réel des images de l’environnement.

Météorologie

GraphCast de Google DeepMind est capable de prévoir le temps avec une précision améliorée de 90 à 99,7 % par rapport aux modèles traditionnels et peut former des prévisions allant jusqu’à 10 jours à l’avance.

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?