Après plus de 50 000 heures d'entraînements sur le jeu vidéo Pokémon Rouge de 96, l’intelligence artificielle du développeur Peter Whidden réussit à battre le premier champion ! Un résultat inattendu…
50 000 heures d’entraînements ?
Après l’IA Ragnarok sur Rocket League, une autre IA s’essaye au jeu vidéo, celle du développeur Peter Whidden sur la version Pokémon Rouge des années 90. Curieux de la réponse, le vidéaste voulait savoir si une intelligence artificielle pouvait réussir à finir un jeu Pokémon, le tout en partant de zéro.
Au début, l’intelligence artificielle n’avait aucune idée de comment “jouer”, elle se contentait d’appuyer aléatoirement sur les boutons d’une manette de GameBoy virtuelle. Mais grâce au reinforcement learning, qui permet à un algorithme de s’améliorer en fonction de ses expériences passées, et presque 6 années de temps de jeu simulé, a globalement compris comment avancer dans l’histoire.
C’est aussi avec l’aide de son créateur que l’IA a pu comprendre qu’il fallait attraper des pokémons, les faire évoluer et aller affronter les maîtres d’arènes. Peter Whidden a ainsi mis en place un système de récompense, pour faire comprendre à l’IA si ses actions étaient bonnes ou mauvaises et quels objectifs elle devait atteindre.
A t-elle fini le jeu ?
Après un achat compulsif de 10 000 magicarpes, un combat ardu contre Pierre, le champion d’Argenta, la première ville du jeu, et une escapade de 300 jours dans la grotte du mont Sélénite, l’IA a pu se frayer un chemin vers la deuxième ville du jeu Azuria.
Une prouesse réalisée par Whidden et son système de récompense. Mais si la réussite n’est pas le fort de l’IA, ce qui amuse le plus son développeur c’est sa manière d’échouer. “Elle n’a pas d’émotions comme un humain, mais un seul événement avec une valeur de récompense extrême peut encore laisser une empreinte durable sur son comportement”, explique Whidden. “Dans le cas où elle perd son Pokémon au Centre Pokémon une seule fois, cela suffit à former une association négative avec tout le CP, et l’IA l’évitera complètement dans tous les futurs jeux.”
Pour faire participer sa communauté à ce jeu, le scientifique des données à rendu open source le code de son algorithme. Désormais, ce sont des dizaines voire des centaines de nouvelles IA qui parcourent les plaines de Pokémon Rouge… et également de la version Cristal, après qu’un abonné ait réussi à implémenter le programme dans le jeu.
Si cet article vous a plu et que l’actualité data vous intéresse ou que vous envisagez une formation en Data Science, n’hésitez pas à découvrir nos articles ou nos offres de formations sur DataScientest.
Source : YouTube @peterwhidden