Depuis la fin d’année 2022, les outils de NLP révolutionnent le quotidien de nombreux domaines de création. En effet, avec l’arrivée de ChatGPT, DALL-E et plus récemment VALL-E, les domaines de l’écrit, de l’image et de l’audio s'automatisent un peu plus chaque jour. Alors qu’on pensait les limites atteintes, Google met la barre encore plus haut avec la création de son IA MusicLM capable de générer des musiques à partir d’une demande écrite.
Comment MusicLM fonctionne-t-elle ?
MusicLM est une intelligence artificielle spécialisée dans la création de musique. Pour réussir à générer des musiques à partir d’une description écrite comme “une chanson de jazz enchanteresse avec un solo de saxophone mémorable et un chanteur soliste”, cette dernière a été entraînée sur un dataset de 280 000 heures de musique. Grâce à son système de machine learning, ses chansons s’améliorent à mesure qu’elle reçoit des retours. Actuellement, ces derniers sons ressemblent à ce qu’un artiste humain pourrait composer, même si elles ne sont pas nécessairement aussi inventives ou cohérentes sur le plan musical.
UNE CARRIÈRE DANS LA DATA VOUS TEND LES BRAS !
Une reconversion dans le big data vous intéresse, mais vous ne savez pas par où commencer ? Découvrez nos formations en Data Science.
Participer à votre première formation data gratuitement !
Assistez aux cours dispensés en live par nos formateurs pour démarrer sur Python, SQL, Power BI…
UNE CARRIÈRE DANS LA DATA VOUS TEND LES BRAS !
Une reconversion dans le big data vous intéresse, mais vous ne savez pas par où commencer ?
Participer à votre première formation data gratuitement !
Quel genre de musique peut-elle produire ?
Les capacités de MusicLM se base sur la description de la musique que l’on veut créer, si l’on souhaite faire une musique de jeu vidéo il faudra le préciser pour que l’algorithme ajoute un filtre synthétique à sa création musicale. Mais, même lorsqu’on lui fournit des descriptions un peu longues et sinueuses, MusicLM parvient à saisir des nuances telles que des riffs instrumentaux, des mélodies et des ambiances.
De plus, les chercheurs de Google montrent que le système peut s’appuyer sur des mélodies existantes, qu’elles soient fredonnées, chantées, sifflées ou jouées sur un instrument.
Sachant que, MusicLM peut prendre plusieurs descriptions écrites dans l’ordre, notamment, « l’heure de méditer », « l’heure de courir », « l’heure de s’amuser » et peut ainsi créer une sorte d’histoire musicale pouvant durer jusqu’à plusieurs minutes.
Cependant, malgré toutes ses possibilités, certains échantillons ont une qualité déformée, un effet secondaire inévitable du fait d’une création synthétique. En effet, le plus marquant s’entend sur les voix générées, y compris celles des harmonies chorales, la plupart possèdent un filtre robotisé. Aussi, la plupart des paroles vont d’un anglais approximatif à un pur charabia, qui ressemblent à des amalgames de plusieurs artistes.
Google ne permet pas encore l’utilisation publique de son outil pour une raison supplémentaire, son modèle se sert parfois de musique non-libre de droit pour créer ces pistes. Même si cela ne représente que 1% des enregistrements créés, et conscient du potentiel malveillant de son système, Google réfléchit encore au moyen de rendre son outil stable et le plus sain possible pour tout le monde.
Les technologies de génération de contenus grâce à une description écrite ont depuis quelque temps le vent en poupe. Grâce à ces derniers de nombreux processus d’entreprises ou de démarches quotidienne deviennent plus facile ou plus rapide à exécuter. Si ce genre de systèmes intelligents vous intéressent, n’hésitez pas à découvrir notre article sur le dernier en date VALL-E, le voicebot de Microsoft. Mais, si jamais vous préférez en apprendre plus sur les projets de Data Science et de musique, découvrez le projet des apprenants de DataScientest PYZZICATO. Dans tous les cas, si la Data Science vous intéresse ou si vous envisagez une carrière dedans, n’hésitez pas à découvrir nos offres de formations et nos autres articles sur DataScientest.
Source : techcrunch.com