Lors de la conférence Google I/O 2024, tenue le 14 mai, Google a dévoilé Veo, un outil d’intelligence artificielle destiné à la génération de vidéos. Ce lancement survient quelques mois après la présentation de Sora par OpenAI, marquant le début d’une nouvelle course à l’innovation.
Une générateur de vidéo multimodal
Veo est capable de générer des vidéos à partir de prompts textuels, mais également à partir d’images et de vidéos, le rendant ainsi multimodal. Cette flexibilité permet une personnalisation quasi-illimitée et une amélioration continue de ses capacités. Ce nouvel outil repose sur des avancées antérieures de Google en matière d’Intelligence Artificielle, incluant des modèles comme Generative Query Network, DVD-GAN, et Imagen-Video. Contrairement à Sora, qui limite les vidéos à 60 secondes, le modèle de Google peut largement dépasser cette limite et atteindre une qualité de 1080p. Les vidéos peuvent également être allongées ou modifiées grâce à un bouton dédié dans l’interface utilisateur.
« Notre équipe a fait des progrès incroyables dans le domaine de la vidéo générative », a déclaré Demis Hassabis, directeur de DeepMind. En effet, les démonstrations lors de la conférence ont mis en lumière des séquences visuellement impressionnantes, sans retouche après génération.
Un autre atout de Veo est sa capacité à comprendre et interpréter divers styles cinématographiques et visuels, grâce à une compréhension approfondie du langage naturel et la sémantique visuelle.
Dans un souci de transparence et pour anticiper les usages frauduleux, Google affirme que les vidéos générées seront marquées avec SynthID, un système de watermarking développé par DeepMind.
Un modèle pour les artistes par les artistes
Pour son lancement, Google a collaboré avec des artistes renommés comme Donald Glover (alias Childish Gambino) et son studio Gilga. L’outil sera initialement accessible via VideoFX, une section de l’AI Test Kitchen de Google, où les utilisateurs pourront s’inscrire sur liste d’attente pour essayer Veo.
« À l’avenir, nous intégrerons certaines des fonctionnalités de Veo à YouTube Shorts et à d’autres produits », a annoncé Google, laissant entrevoir une adoption plus large de cette technologie sur les plateformes de vidéo courtes et autres produits Google.
Si cet article vous a plu et si vous envisagez une carrière dans la Data Science ou tout simplement une montée en compétences dans votre domaine, n’hésitez pas à découvrir nos offres de formations ou nos articles de blog sur DataScientest.
Source : Deepmind.google.com