LLaMa : tout savoir sur le modèle de langage de Meta

-
3
 m de lecture
-

Contre toute attente, LLaMa, le modèle d’intelligence artificielle proposé par Meta, connaît un succès remarquable. Au risque de faire de l’ombre à ChatGPT, Google Gemini et autres stars du lot. Comment expliquer cette montée en popularité rapide et soudaine ?

Pour un succès, c’est un succès. Fin août 2024, LLaMa dénombrait 350 millions de téléchargements, pulvérisant les records en matière de LLM (Large Langage Model – un modèle conçu pour comprendre et générer du texte en langage naturel, entraîné sur un vaste volume de documents).

En tant que LLM, LLaMa est comparable à GPT, le modèle sur lequel s’appuie ChatGPT ou encore DeepMind, celui sur lequel s’appuie Google Gemini. Pourtant, il se veut différent…

LLaMa, le croisé de l’open source

Ce qui caractérise LLaMa est qu’il s’agit d’un LLM open source. Cela signifie qu’il est accessible gratuitement, mais aussi que n’importe qui peut intervenir sur le code et affiner certains aspects.  Un projet open source peut bénéficier des apports de milliers de développeurs hors pair. C’est un des aspects qui a fait la popularité de Linux : la sécurité a été renforcée par des armées de contributeurs à l’affût.

Au niveau de l’utilisateur, un avantage vient de ce qu’il est possible de le télécharger intégralement sur son ordinateur – sachant qu’il faut tout de même une sacrée configuration pour la version la plus avancée – et donc l’utiliser sans connexion Internet. Il faut juste savoir que ses connaissances sont limitées à décembre 2023.

Pourtant, LLaMa est un LLM produit par la société Meta, et donc celle qui gère Facebook, Instagram ou Whatsapp. Et des centaines de millions de dollars ont été investis dans son développement.

Pourquoi Zuckerberg a-t-il choisi une telle approche ? Nous y reviendrons.

Des performances acclamées

Le facteur open source serait négligeable si les performances n’étaient pas au rendez-vous. Or, à chaque version, LLaMa a démultiplié ses capacités. Il est vrai aussi que les versions se sont succédé rapidement :

  • LLaMa 1 : février 2023
  • LLaMa 2 : juillet 2023
  • LLaMa 3 : avril 2023 – disponible en deux versions : 8B (8 milliards de paramètres) et 70B (70 milliards).
  • LLaMa 3.1 : fin juillet 2024

C’est à partir de la version 3 que LLaMa a commencé à faire l’objet d’éloges appuyés, se voyant qualifié par certains de « surpuissant ». Et ses performances ont été reconnues par des benchmark comme MMLu. Les taux de réussite de 3 des principaux LLM étaient les suivants :

Gemini Ultra 90 %
GPT-4 86 %
LLaMa 70B 82 %

LLaMa 3.1 a représenté un pas en avant considérable, puisque la version 405 B repose sur 405 milliards de paramètres. Cette fois, au test MMLu, le score obtenu (88,6 %) est à peine inférieur à celui de GTP4-o (88,7 %).

Pourquoi Meta a-t-elle choisi la formule open source ?

Mark Zuckerberg a profité de LLaMa pour se faire connaître comme un supporter de la formule open source. En réalité, Meta se retrouve gagnant à plus d’un titre.

  • Dans la Silicon Valley, les préceptes de Sun Tzu sont appréciés et l’un d’eux est le suivant : « si tu ne peux pas vaincre sur un champ de bataille, change le champ de bataille. » Or, en proposant LLaMa gratuitement, Meta coupe l’herbe sous le pied de ses trois principaux concurrents : OpenAI, Google et Anthropic (Claude). Et ce, avant qu’ils n’aient plus rafler l’essentiel du marché de l’IA.
  • Au passage, Meta peut redorer son blason, suite aux affaires de négligence de la vie privée qui ont entaché son parcours.
  • De par la nature de l’open source, LLaMa peut bénéficier des retours de milliers de développeurs.
  • Le côté open source et donc non propriétaire peut rassurer bien des sociétés inquiètes de ce que des IA comme ChatGPT ou Gemini puissent analyser leurs informations. Ainsi, Samsung, Amazon ou Apple ont fait interdire l’usage de ChatGPT dès la fin du printemps 2023. Il en a été de même pour divers cabinets d’avocats, hôpitaux ou organisations gouvernementales.
  • Meta est en mesure de proposer l’intégration de LLaMa 3 à des entreprises dans le cadre de tâches sur mesure, tout en se prévalant d’une technologie éprouvée.
  • Là où Amazon, Microsoft et Google se sont imposés dans le cloud, Meta trouve dans l’IA un domaine où elle peut s’imposer à grande échelle face aux autres GAFAM.
  • Zuckerberg se voit désormais interviewé en tant que guru de l’open source et a beau jeu de se livrer à des déclarations telles que « l’IA open source va devenir le standard de l’industrie ». « LLaMa n’est pas une technologie mais un écosystème »… Et de fait, LLaMa 3 a rapidement été intégré dans l’offre de géants tels que Amazon Web Services et Microsoft Azure, Zoom ou encore AT&T.

En français dans le texte ?

Pour toucher le grand public, il faut une interface aussi simple d’usage que celle de ChatGPT. Elle existe sous la forme d’une app, nommée Meta AI. Tout comme ChatGPT, elle peut générer des images et même les animer.

Toutefois, ce qui a pu freiner l’audience de Meta AI est que, début septembre 2024, cette app n’était pas encore accessible en Europe (officiellement, en raison de problèmes de régulations) et donc en France.

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?