Depuis l’apparition de GPT 3.5, les progrès autour de l’intelligence artificielle se sont décuplés. Chaque semaine, de nouvelles applications ou algorithmes voient le jour et les grandes entreprises s’engouffrent dans une course à la performance.
Ayant annoncé GPT 4 et la sortie prochaine de GPT 5, OpenAI, partenaire de Microsoft, semble prendre la tête de la compétition. Face à ces prises de position, Google DeepMind dévoile leur nouvel algorithme, Gemini.
Alors, de quoi est donc capable Gemini ? A-t-il le potentiel de remplacer GPT ? Découvrons dans cet article le potentiel du nouvel algorithme d’Alphabet.
Qu’est-ce que Google Gemini ?
Dévoilé lors de la conférence Google I/O 2023 par Sundar Pichai, CEO de Google, Google Gemini est le premier projet de Google DeepMind, l’union entre Google Brain et DeepMind, deux sections de développement en intelligence artificielle de Google.
Google Brain étant le fondateur d’AlphaGo, une intelligence artificielle ayant battu le champion du monde de Go Ke Jie en 2017, et DeepMind un pionnier des modèles de renforcement par apprentissage, Google pense que de nouvelles capacités d’IA seront découvertes grâce à cette fusion.
Actuellement en développement par les équipes de Google DeepMind, le projet final devrait voir le jour dans plusieurs mois, soit en 2024. Ce que l’on sait néanmoins c’est que Gemini sera un algorithme de génération, de planification et de résolution de problème, comme ChatGPT 4.
Quelles sont ses fonctionnalités ?
Selon une interview de Demis Hassabis, directeur général de Google DeepMind, Gemini utilisera les technologies développées pour et grâce à AlphaGo et des techniques de reinforcement learning couplées aux capacités linguistiques du LLM de Google, PaLM 2.
Gemini sera un algorithme multimodal, cela signifie qu’il pourra tirer des informations de différentes sources de données simultanément. Ces utilisateurs pourront alors lui fournir des données vidéos, graphiques ou textuelles afin qu’il élabore des réponses et des solutions plus concrètes.
Si Gemini n’est pas le premier algorithme multimodal à être créé, GPT 4 ou LLaMA le sont également, Google aborde l’utilisation de ces données d’une façon qui le différencie de ses concurrents. Pour Google, ses technologies doivent être accessibles à tous, sans compromettre leur vie privée. C’est pourquoi l’entreprise s’est engagée à n’utiliser que des bases de données libres de droits ou public pour entraîner son nouveau modèle. L’objectif est de donner une image éthique à l’IA et s’opposer aux critiques dont souffre une partie des concurrents.
Google Gemini va-t'il remplacer GPT ?
Selon les informations disponibles, Gemini devrait dépasser les mille milliards de paramètres de GPT 4. Un chiffre à reconsidérer quand on sait que LLaMA et ses 70 milliards de paramètres proposent des performances similaires à GPT 4 sur certains points.
En termes de budget, M. Hassabis estime que Gemini pourrait coûter plusieurs dizaines, voire centaines, de millions de dollars, un chiffre qui se rapproche des 100 millions annoncés par Sam Altman, CEO d’OpenAI, pour la création de GPT 4.