Alors que la barrière de l’image, de la vidéo et de l’écrit viennent d’être franchis par les intelligences artificielles comme ChatGPT, FILM et DALL-E, celle de l’audio manque à l’appel. Afin de diversifier le domaine de l’intelligence artificielle, ElevenLabs, met au point une IA capable de convertir des textes en paroles humaines, incluant des émotions et des tons de voix si nécessaire.
Comment fonctionne cette IA ?
Tout d’abord, cette solution est une intelligence artificielle de deep learning capable de convertir un texte, court ou long, en parole dans n’importe quelle voix et avec une émotion particulière, si nécessaire. Cependant, elle n’est disponible qu’en anglais et en polonais.
À ce jour, ElevenLabs produit des voix artificielles, mais peut également cloner des voix existantes, par exemple, un livre peut être lu dans la voix d’une célébrité.
À savoir que, la solution a été testée par 250 clients et sera plus largement disponible en février. De plus, ElevenLabs veut élargir sa solution à l’échelle mondiale, afin qu’elle soit disponible dans toutes les langues. Aussi, ces développeurs souhaitent également entamer des recherches sur le doublage automatique d’une langue à l’autre avec la même voix.
UNE CARRIÈRE DANS LA DATA VOUS TEND LES BRAS !
Une reconversion dans le big data vous intéresse, mais vous ne savez pas par où commencer ? Découvrez nos formations en Data Science.
Participer à votre première formation data gratuitement !
Assistez aux cours dispensés en live par nos formateurs pour démarrer sur Python, SQL, Power BI…
UNE CARRIÈRE DANS LA DATA VOUS TEND LES BRAS !
Une reconversion dans le big data vous intéresse, mais vous ne savez pas par où commencer ?
Participer à votre première formation data gratuitement !
Quelle est l’utilité de cette IA ?
ElevenLabs souhaite faciliter le travail des créateurs de contenu avec cet outil de Big Data. De ce fait, l’équipe de la société espère voir leur application être utilisée pour le doublage de films, les émissions de télévision ou les communications radio. Également, elle pourrait servir aux éditeurs de livres ou aux journalistes de presse.
Ces derniers mois, les progrès de l’intelligence artificielle ont permis la création de contenus graphiques, textuels et maintenant auditifs. Grâce à cela, les créateurs de contenu voient leur travail faciliter par des outils d’intelligence artificielle comme ChatGPT, un chatbot générateur de texte automatisé. Mais aussi, VALL-E un logiciel de synthétisation vocale. C’est pourquoi, si cet article vous a plu, et si vous envisagez une carrière dans la Data Science, n’hésitez pas à découvrir nos offres de formations sur DataScientest.
Source : sifted.eu