Les réseaux de neurones artificiels sont au cœur des progrès spectaculaires que l’intelligence artificielle a connu récemment. Comment fonctionnent-ils et qu’est ce qui fait leur force ?
Le modèle mathématique des réseaux de neurones artificiels (RNA) a été initialement proposé en 1943 par deux chercheurs de l’Université de Chicago : Warren McCullough, et Walter Pitts. Dans un article du journal Brain Theory, ils ont énoncé une théorie articulée autour du neurone comme élément fondamental de l’activité de réaction à des événements externes.
Il a fallu attendre 1957 pour que soit développé le premier prototype exploitant les RNA : le Perceptron de Frank Rosenblatt. Celui-ci tentait d’accomplir des tâches de reconnaissance à partir d’un algorithme d’apprentissage répétitif. Toutefois, à l’époque, les ordinateurs n’étaient pas assez puissants pour traiter les volumes de données nécessaires à une évaluation pratique de situations du monde réel. C’est ce qu’ont constaté Marvin Minsky et Seymour Papert dans le livre Perceptrons (1969), où ils soulignaient les limitations des réseaux de neurones. La recherche va marquer une pause durant près de deux décennies.
Une première percée a eu lieu en 1986 lorsque David Rumelhart, Geoffrey Hinton et Ronald Williams ont publié un essai sur la rétropropagation progressive, une technique d’apprentissage qui relance l’intérêt pour les réseaux neuronaux.
Toutefois, il a fallu attendre l’essor du Big Data et des ordinateurs massivement parallèles pour que les réseaux de neurones disposent d’une capacité de traitement adéquate. En 2012, une étape a été franchie lorsque l’équipe d’Alex Krizhevsky a remporté la compétition ImageNet portant sur la reconnaissance d’image.
Qu'est-ce qu'un réseau de neurones artificiel ?
Un réseau de neurones artificiel apprend en analysant des exemples prédéfinis. Il s’entraîne à développer un modèle mathématique prédictif, par exemple la reconnaissance d’objets dans une image. Pour ce faire, un RNA s’appuie sur un grand nombre de processeurs organisés en couches et opérant en parallèle. Trois types de couches sont à considérer.
1. Couche d'entrée
Cette couche est celle qui réceptionne les informations brutes. Par comparaison, nous pouvons considérer que les nerfs optiques perçoivent une image avant de l’analyser.
2. Couches intermédiaires cachées
La donnée brute va transiter par plusieurs couches qui chacune va opérer une analyse partielle de l’information avant de la transmettre à la suivante.
3. Couche de sortie
La toute dernière couche produit le résultat final, soit l’information analysée.
Ajustement des couches
En réalité, ce processus peut être effectué plusieurs fois auquel cas le RNA suit une phase d’apprentissage au cours de laquelle il ajuste ses poids, soit l’importance de chacune des couches.
Inférences
Le réseau peut progressivement opérer des inférences soit des prédictions ou déductions applicables sur de nouvelles données.
Quels sont les types de réseaux de neurones ?
Réseaux feedfoward
Dans un tel RNA, l’information circule dans une seule direction, de l’entrée vers la sortie.
Réseaux récurrent (RNN)
Les RNN gèrent des couches récurrentes : ils “mémorisent » des informations des étapes précédentes. Cela les rend efficaces pour des tâches comme la reconnaissance vocale (ils peuvent identifier des mots en tenant compte des sons précédents), la traduction automatique ou l’analyse de texte (en établissant des relations entre les mots déjà analysés).
Réseaux antagonistes génératifs (GAN)
Ce modèle d’intelligence artificielle utilise deux réseaux de neurones en compétition pour générer des données réalistes.
Réseaux convolutifs (RCNN)
Ils sont principalement utilisés pour traiter des données structurées en grille, comme les images et sont donc très efficaces pour des applications comme la reconnaissance faciale.
Quelles applications concrètes ?
Les RNA sont à la base des immenses progrès récents de l’intelligence artificielle et nous les retrouvons au sein d’un très grand nombre d’applications.
Vision par ordinateur
Les algorithmes DeepFace de reconnaissance faciale de Facebook se sont avérés si efficaces (une précision de 97,35% en 2014) que Meta a jugé préférable d’en suspendre l’usage suite à diverses polémiques concernant la vie privée.
Art et créativité
Les IA génératives telles que Midjourney, Leonardo (images), mais aussi Suno (chansons), Gen 3 de Runway (vidéos), capables de réaliser des œuvres à partir de descriptions textuelles sont l’un des exemples les plus marquants de l’usage des RNA.
Traitement du langage naturel
Les assistants vocaux tels que Siri, Alexa, Google Assistant ou Cortana s’appuient sur des RNAs.
Jeux et prise de décision
En 2016, AlphaGo, un outil développé par DeepMind, une filiale de Google, a battu le champion du monde de Go, un jeu réputé pour sa complexité et l’étendue des combinaisons possibles, avec un score sans appel de 5 à 0. Un tel exploit semblait impossible dix ans plus tôt.
Finance
Le RNA mis en place par Paypal pour détecter des transactions frauduleuses a réduit le taux de fraude à 0,28 % en 2024.
Automobile
Un véhicule autonome tel que Waymo (également connue comme la Google Car) se sert de RNA (des CNN) pour l’analyse en temps réel des images de l’environnement.
Météorologie
GraphCast de Google DeepMind est capable de prévoir le temps avec une précision améliorée de 90 à 99,7 % par rapport aux modèles traditionnels et peut former des prévisions allant jusqu’à 10 jours à l’avance.