Hugging Face est une entreprise fournissant des bibliothĂšques open source contenant des modĂšles prĂ©-formĂ©s. SpĂ©cialisĂ© dans le machine learning, Hugging Face a su dĂ©velopper son activitĂ© avec plusieurs produits innovants basĂ©s sur lâIA. Aujourdâhui, lâentreprise entend devenir le "GitHub du machine learning".
Quâest-ce que Hugging Face ?
Hugging Face est une startup française crĂ©Ă©e en 2015 par Julien Chaumond et ClĂ©ment Delangue. Leur objectif : rendre lâintelligence artificielle accessible Ă tous.
Pour cela, Hugging Face propose une librairie NLP (Natural language Processing) open-source. Câest-Ă -dire quâils offrent Ă leurs clients une API facilitant lâaccĂšs Ă des modĂšles prĂ©-entraĂźnĂ©s. Comme ces modĂšles de machine learning sont dĂ©jĂ entraĂźnĂ©s, leur apprentissage et expĂ©rimentation sont simplifiĂ©s. En prime, ils proposent aussi des outils pour la gestion des donnĂ©es et des modĂšles existants, le dĂ©veloppement et l’entraĂźnement de nouveaux modĂšles.
Depuis ses dĂ©buts, lâentreprise connaĂźt une croissance exponentielle et est en voie de devenir lâun des rĂ©fĂ©rents dans le secteur de lâintelligence artificielle. En 2020, elle a dâailleurs Ă©tĂ© nommĂ©e comme Ă©tant lâune des entreprises les plus innovantes au monde par MIT Technology Review.
Quelles sont les solutions de Hugging Face ?
Au fil des annĂ©es, Hugging Face a su dĂ©velopper une gamme de produits innovante basĂ©e sur lâIA. DĂ©couvrez les principaux.
La bibliothĂšque Transformers
Pour aider sa communautĂ© Ă gĂ©rer et dĂ©velopper ses modĂšles de Machine Learning, Hugging Face propose plusieurs librairies open source. La plus connue Ă©tant Transformers, une bibliothĂšque conçue pour entraĂźner et dĂ©ployer des modĂšles NLP basĂ©s sur Python. Ils peuvent alors rĂ©aliser une variĂ©tĂ© de tĂąches relatives au traitement du langage naturel, comme la classification, la gĂ©nĂ©ration de texte, la dĂ©tection d’entitĂ©s nommĂ©es, lâextraction dâinformations, la rĂ©ponse aux questionsâŠ
Pour rĂ©aliser toutes ces tĂąches, Tranformers fonctionne grĂące Ă l’entraĂźnement Ă lâinfĂ©rence.Â
- L’entraĂźnement est la mĂ©thode traditionnellement utilisĂ©e en machine learning. Il suffit de prĂ©senter des donnĂ©es Ă©tiquetĂ©es pour que le modĂšle se forme progressivement. Ses performances augmentent ainsi Ă mesure quâil s’entraĂźne.
- De son cĂŽtĂ©, lâinfĂ©rence permet de concevoir des modĂšles beaucoup plus avancĂ©s, puisquâils s’entraĂźnent Ă travers des informations non Ă©tiquetĂ©es. Chaque modĂšle va apprendre par lui-mĂȘme (toujours sur la base de rĂ©fĂ©rences apprises en amont).
Les autres bibliothĂšques
En plus de Transformers, Hugging Face propose aussi sa bibliothĂšque Datasets permettant dâaccĂ©der Ă plus de 100 jeux de donnĂ©es NLP. Ou encore Tokenizers qui tokenize plus de 40 langues.
Bon Ă savoir : en parallĂšle, Hugging Face propose une formation en NLP. Les utilisateurs peuvent alors se former grĂące Ă toutes ces bibliothĂšques disponibles.
Accelerate
Il sâagit dâune API permettant aux dĂ©veloppeurs et data scientists dâexĂ©cuter leurs scripts et de coder leurs propres boucles dâentraĂźnement. Et ce, dans diffĂ©rents types de configuration.
Et pour faciliter lâapprentissage du NLP, Hugging Face propose aussi Ă ses utilisateurs un outil CLI permettant de configurer et de tester rapidement les environnements d’entraĂźnement.
Spaces
Hugging Face sâĂ©tant dĂ©veloppĂ© dans une vĂ©ritable stratĂ©gie communautaire, elle propose aussi lâhĂ©bergement de modĂšles. Plus prĂ©cisĂ©ment, une zone dâĂ©change oĂč les membres de la communautĂ© partagent leurs applications de Machine Learning.
Ils peuvent alors créer directement leurs apps avec Hugging Face. Et grùce au contrÎle des versions, la collaboration est simplifiée pour concevoir des modÚles ML encore plus performants et innovants.
Les chatbots
Hugging Face sâest dâabord fait connaĂźtre Ă travers ses applications de chatbot. Il convient donc de les mentionner, mĂȘme sâil ne sâagit plus de leur cĆur de mĂ©tier. Ces derniĂšres ont Ă©tĂ© dĂ©veloppĂ©es grĂące au modĂšle de traitement du langage naturel de lâentreprise (Hierarchical Multi-Task Learning – HMTL). Parmi les applications disponibles, on retrouve Chatty>, Talking Dog, Talking Egg ou encore Boloss.
Ă lâorigine, il sâagissait surtout de chatbots pour adolescents. Mais progressivement, Hugging Face sâest dĂ©veloppĂ© jusquâĂ devenir une rĂ©fĂ©rence dans le domaine du Machine Learning.
Quel avenir pour Hugging Face ?
Si Hugging a commencĂ© comme Ă©tant un simple chatbot pour adolescent, leur ambition va aujourdâhui bien plus loin.Â
Et pour cause, depuis leur crĂ©ation, ils multiplient les levĂ©es de fonds.Â
- DĂšs 2017, ils lĂšvent 1,2 million de dollars en prĂ©-seed ;Â
- En 2018, câest 4 millions en seed ;
- En 2019, Hugging Face lĂšve 15 millions de dollars de financement pour une sĂ©rie A ;Â
- En 2021, ils passent à 40 millions pour une série B, puis 100 millions pour une série C.
Mais alors pourquoi faire ? Devenir le « GitHub du Machine Learning » et dĂ©mocratiser lâintelligence artificielle. Et le moins que lâon puisse dire, câest que la mission est rĂ©ussie. Dâune part, la startup française est dĂ©jĂ utilisĂ©e par les grands noms de la tech, tels que les Ă©quipes de Google, Meta, Microsoft ou encore Intel. Ce qui prouve quâelle fait dâores et dĂ©jĂ figure de rĂ©fĂ©rence.Â
Dâautre part, Hugging Face et Amazon Web Service ont annoncĂ© leur partenariat en fĂ©vrier 2023. Lâobjectif Ă©tant dââaccĂ©lĂ©rer la disponibilitĂ© des modĂšles nouvelle gĂ©nĂ©ration de Machine Learning, en les rendant plus accessibles Ă la communautĂ© et en aidant les dĂ©veloppeurs Ă obtenir de meilleures performances Ă moindre coĂ»tâ.
DĂ©veloppez vos connaissances en ML avec DataScientest
Si Hugging Face entend dĂ©mocratiser lâIA, il nâen reste pas moins que le machine learning nĂ©cessite des compĂ©tences spĂ©cifiques. DâoĂč la nĂ©cessitĂ© de se former. Câest justement possible avec DataScientest. Ă travers nos formations en science des donnĂ©es ou traitement du langage naturel, vous dĂ©velopperez toutes les connaissances pratiques et thĂ©oriques pour concevoir vos propres modĂšles NLP.