Hugging Face đŸ€— : Tout ce qu’il faut savoir sur cette startup IA

-
3
 m de lecture
-

Hugging Face est une entreprise fournissant des bibliothĂšques open source contenant des modĂšles prĂ©-formĂ©s. SpĂ©cialisĂ© dans le machine learning, Hugging Face a su dĂ©velopper son activitĂ© avec plusieurs produits innovants basĂ©s sur l’IA. Aujourd’hui, l’entreprise entend devenir le "GitHub du machine learning".

Qu’est-ce que Hugging Face ?

Hugging Face est une startup française crĂ©Ă©e en 2015 par Julien Chaumond et ClĂ©ment Delangue. Leur objectif : rendre l’intelligence artificielle accessible Ă  tous.

Pour cela, Hugging Face propose une librairie NLP (Natural language Processing) open-source. C’est-Ă -dire qu’ils offrent Ă  leurs clients une API facilitant l’accĂšs Ă  des modĂšles prĂ©-entraĂźnĂ©s. Comme ces modĂšles de machine learning sont dĂ©jĂ  entraĂźnĂ©s, leur apprentissage et expĂ©rimentation sont simplifiĂ©s. En prime, ils proposent aussi des outils pour la gestion des donnĂ©es et des modĂšles existants, le dĂ©veloppement et l’entraĂźnement de nouveaux modĂšles.

Depuis ses dĂ©buts, l’entreprise connaĂźt une croissance exponentielle et est en voie de devenir l’un des rĂ©fĂ©rents dans le secteur de l’intelligence artificielle. En 2020, elle a d’ailleurs Ă©tĂ© nommĂ©e comme Ă©tant l’une des entreprises les plus innovantes au monde par MIT Technology Review.

Quelles sont les solutions de Hugging Face ?

Au fil des annĂ©es, Hugging Face a su dĂ©velopper une gamme de produits innovante basĂ©e sur l’IA. DĂ©couvrez les principaux.

La bibliothĂšque Transformers

Pour aider sa communautĂ© Ă  gĂ©rer et dĂ©velopper ses modĂšles de Machine Learning, Hugging Face propose plusieurs librairies open source. La plus connue Ă©tant Transformers, une bibliothĂšque conçue pour entraĂźner et dĂ©ployer des modĂšles NLP basĂ©s sur Python. Ils peuvent alors rĂ©aliser une variĂ©tĂ© de tĂąches relatives au traitement du langage naturel, comme la classification, la gĂ©nĂ©ration de texte, la dĂ©tection d’entitĂ©s nommĂ©es, l’extraction d’informations, la rĂ©ponse aux questions


Pour rĂ©aliser toutes ces tĂąches, Tranformers fonctionne grĂące Ă  l’entraĂźnement Ă  l’infĂ©rence. 

  • L’entraĂźnement est la mĂ©thode traditionnellement utilisĂ©e en machine learning. Il suffit de prĂ©senter des donnĂ©es Ă©tiquetĂ©es pour que le modĂšle se forme progressivement. Ses performances augmentent ainsi Ă  mesure qu’il s’entraĂźne.
  • De son cĂŽtĂ©, l’infĂ©rence permet de concevoir des modĂšles beaucoup plus avancĂ©s, puisqu’ils s’entraĂźnent Ă  travers des informations non Ă©tiquetĂ©es. Chaque modĂšle va apprendre par lui-mĂȘme (toujours sur la base de rĂ©fĂ©rences apprises en amont).

Les autres bibliothĂšques

En plus de Transformers, Hugging Face propose aussi sa bibliothĂšque Datasets permettant d’accĂ©der Ă  plus de 100 jeux de donnĂ©es NLP.  Ou encore Tokenizers qui tokenize plus de 40 langues.

Bon Ă  savoir : en parallĂšle, Hugging Face propose une formation en NLP. Les utilisateurs peuvent alors se former grĂące Ă  toutes ces bibliothĂšques disponibles.

Accelerate

Il s’agit d’une API permettant aux dĂ©veloppeurs et data scientists d’exĂ©cuter leurs scripts et de coder leurs propres boucles d’entraĂźnement. Et ce, dans diffĂ©rents types de configuration.

Et pour faciliter l’apprentissage du NLP, Hugging Face propose aussi Ă  ses utilisateurs un outil CLI permettant de configurer et de tester rapidement les environnements d’entraĂźnement.

Spaces

Hugging Face s’étant dĂ©veloppĂ© dans une vĂ©ritable stratĂ©gie communautaire, elle propose aussi l’hĂ©bergement de modĂšles. Plus prĂ©cisĂ©ment, une zone d’échange oĂč les membres de la communautĂ© partagent leurs applications de Machine Learning.

Ils peuvent alors créer directement leurs apps avec Hugging Face. Et grùce au contrÎle des versions, la collaboration est simplifiée pour concevoir des modÚles ML encore plus performants et innovants.

Les chatbots

Hugging Face s’est d’abord fait connaĂźtre Ă  travers ses applications de chatbot. Il convient donc de les mentionner, mĂȘme s’il ne s’agit plus de leur cƓur de mĂ©tier. Ces derniĂšres ont Ă©tĂ© dĂ©veloppĂ©es grĂące au modĂšle de traitement du langage naturel de l’entreprise (Hierarchical Multi-Task Learning – HMTL). Parmi les applications disponibles, on retrouve Chatty>, Talking Dog, Talking Egg ou encore Boloss.

À l’origine, il s’agissait surtout de chatbots pour adolescents. Mais progressivement, Hugging Face s’est dĂ©veloppĂ© jusqu’à devenir une rĂ©fĂ©rence dans le domaine du Machine Learning.

Quel avenir pour Hugging Face ?

Si Hugging a commencĂ© comme Ă©tant un simple chatbot pour adolescent, leur ambition va aujourd’hui bien plus loin. 

Et pour cause, depuis leur création, ils multiplient les levées de fonds. 

  • DĂšs 2017, ils lĂšvent 1,2 million de dollars en prĂ©-seed ; 
  • En 2018, c’est 4 millions en seed ;
  • En 2019, Hugging Face lĂšve 15 millions de dollars de financement pour une sĂ©rie A ; 
  • En 2021, ils passent Ă  40 millions pour une sĂ©rie B, puis 100 millions pour une sĂ©rie C.

Mais alors pourquoi faire ? Devenir le « GitHub du Machine Learning » et dĂ©mocratiser l’intelligence artificielle.  Et le moins que l’on puisse dire, c’est que la mission est rĂ©ussie. D’une part, la startup française est dĂ©jĂ  utilisĂ©e par les grands noms de la tech, tels que les Ă©quipes de Google, Meta, Microsoft ou encore Intel. Ce qui prouve qu’elle fait d’ores et dĂ©jĂ  figure de rĂ©fĂ©rence. 

D’autre part, Hugging Face et Amazon Web Service ont annoncĂ© leur partenariat en fĂ©vrier 2023. L’objectif Ă©tant d’“accĂ©lĂ©rer la disponibilitĂ© des modĂšles nouvelle gĂ©nĂ©ration de Machine Learning, en les rendant plus accessibles Ă  la communautĂ© et en aidant les dĂ©veloppeurs Ă  obtenir de meilleures performances Ă  moindre coĂ»t”.

DĂ©veloppez vos connaissances en ML avec DataScientest

Si Hugging Face entend dĂ©mocratiser l’IA, il n’en reste pas moins que le machine learning nĂ©cessite des compĂ©tences spĂ©cifiques. D’oĂč la nĂ©cessitĂ© de se former. C’est justement possible avec DataScientest. À travers nos formations en science des donnĂ©es ou traitement du langage naturel, vous dĂ©velopperez toutes les connaissances pratiques et thĂ©oriques pour concevoir vos propres modĂšles NLP. 

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les derniÚres actualités data directement dans votre boßte mail.

Vous souhaitez ĂȘtre alertĂ© des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?