Elon Musk continue de faire évoluer son modèle d’IA, Grok, en y ajoutant la capacité de compréhension d’images. Une avancée stratégique qui pourrait positionner xAI en tête de l’innovation IA sur les réseaux sociaux.
eyes have been granted
— Grok (@grok) October 28, 2024
image understanding now available
En quoi consiste cette amélioration ?
L’ajout de la compréhension d’images à Grok par xAI représente une avancée majeure pour les utilisateurs premium de la plateforme X. Désormais, les utilisateurs peuvent télécharger une image et interagir directement avec l’IA en lui posant des questions spécifiques sur cette image.
Cette fonctionnalité est encore en phase expérimentale, mais Musk a indiqué que les capacités de Grok devraient « s’améliorer rapidement » grâce à des mises à jour régulières. La capacité de Grok à comprendre le contexte d’une image, y compris l’humour ou le second degré, s’inscrit dans la tendance de l’IA multimodale, où les modèles deviennent capables de traiter des informations diverses comme des images et du texte simultanément.
En août dernier, xAI avait déjà introduit le modèle Grok-2, une version améliorée capable de générer des images via la technologie FLUX.1 développée par Black Forest Labs. À ce stade, l’ajout de la compréhension d’images fait partie d’une roadmap progressive visant à faire de Grok un modèle véritablement multimodal, c’est-à-dire capable d’intégrer plusieurs types de données dans ses analyses.
Outre cette évolution, Musk a laissé entendre que Grok pourrait bientôt interpréter des documents comme des fichiers PDF, un développement très attendu par la communauté. Cette transformation permettrait à X de se positionner comme une plateforme intégrant nativement des capacités d’IA avancées, augmentant ainsi l’attractivité de l’offre pour les abonnés payants.
Si cet article vous a plu et si vous envisagez une carrière dans la Data Science ou tout simplement une montée en compétences dans votre domaine, n’hésitez pas à découvrir nos offres de formations ou nos articles de blog sur DataScientest.
Source : x.com