Sorti en février 2023, Gen-1 faisait un premier pas dans le domaine de la création audiovisuelle par intelligence artificielle. Aujourd’hui sa deuxième version, Gen-2, repousse les limites déjà atteintes et intègre de nouveaux outils de créations de vidéos.
En quoi consiste cette nouvelle version ?
Gen-2 est la fusion de Runway ML, un système de création de vidéo à partir d’un texte, et de la précédente version Gen-1. Ce nouveau modèle de génération permet de concevoir des vidéos avec uniquement des prompts textuels et de les modifier. Grâce à la technologie de Gen-1, les vidéos générées peuvent être éditées de sorte à changer le texte, la durée, la résolution ou le cadre temporel. Ainsi, on peut décider d’ajouter ou de supprimer des scènes, de changer les décors ou l’angle de la caméra.
Mais Gen-2 n’est pas qu’une simple fusion, il est aussi beaucoup plus entraîné et développé que son prédécesseur. Pour cela, il utilise un dataset de 100 millions d’images et d’un million de vidéos.
UNE CARRIÈRE DANS LA DATA VOUS TEND LES BRAS !
Une reconversion dans le big data vous intéresse, mais vous ne savez pas par où commencer ? Découvrez nos formations en Data Science.
Participer à votre première formation data gratuitement !
Assistez aux cours dispensés en live par nos formateurs pour démarrer sur Python, SQL, Power BI…
UNE CARRIÈRE DANS LA DATA VOUS TEND LES BRAS !
Une reconversion dans le big data vous intéresse, mais vous ne savez pas par où commencer ?
Participer à votre première formation data gratuitement !
Quel est son potentiel de création ?
Pour avoir la chance de tester Gen-2, il faut être un heureux sélectionné sur une liste d’attente Discord. Mais le potentiel de cette intelligence artificielle dépasse celui des modèles existants. Néanmoins, elle reste une solution propriétaire, ce qui signifie qu’il est impossible d’accéder à son code ou à ses datasets d’entraînements. De nombreuses solutions open source existent comme ModelScope, mais les performances et la qualité ne sont pas les mêmes. Loin d’être du niveau d’Hollywood, Gen-2 peut créer des vidéos de 30 secondes en 1024×1024 et sa qualité évolue à mesure qu’elle crée et que ses utilisateurs lui font des retours.
Maintenant que les IA génératrices d’images sont devenues performantes voire auto-suffisantes, les développeurs se penchent sérieusement sur la vidéo et la programmation. De nombreuses entreprises comme Google qui s’associe à Replit pour concurrencer le nouveau GitHub. C’est pourquoi, si cet article vous a plu et si vous envisagez une carrière dans la Data Science, n’hésitez pas à découvrir nos articles ou nos offres de formations sur DataScientest.
Source : research.runwayml.com