Deep Research d’OpenAI cloné et accessible en open source en seulement 24 heures

-
3
 m de lecture
-

L’intelligence artificielle évolue à un rythme effréné, et la bataille entre modèles propriétaires et open source atteint une intensité inédite. Le 2 février 2025, OpenAI dévoile Deep Research, un agent d’IA avancé capable de parcourir le web, d’analyser des centaines de sources et de produire des rapports détaillés en quelques minutes. Moins de 24 heures après cette annonce, Hugging Face riposte en publiant un clone open source, baptisé Open Deep Research. 

À peine arrivé, déjà cloné

L’annonce de Deep Research par OpenAI a fait grand bruit. Présenté comme une avancée majeure dans l’automatisation des recherches en ligne, cet agent d’IA promet d’exécuter en quelques minutes ce qui prendrait des heures à un humain. Grâce à une architecture agentique sophistiquée, il collecte et synthétise des informations issues de multiples sources, offrant un gain de productivité considérable pour les analystes et les chercheurs.

Actuellement indisponible et prévu pour GPT-o3, Hugging Face a décidé de remédier à ce problème. En moins d’une journée, ses ingénieurs ont mis au point Open Deep Research, un équivalent open source basé sur le même concept. Selon l’équipe, ce clone atteint 55,15 % de précision sur le benchmark GAIA, contre 67,36 % pour le modèle propriétaire d’OpenAI en réponse unique. Une performance impressionnante, d’autant que le code est entièrement disponible sur GitHub, permettant à la communauté de modifier et personnaliser l’agent à sa guise.

Techniquement, Hugging Face a misé sur une approche agentique similaire en s’appuyant sur sa bibliothèque smolagents, qui exploite des agents de code. Contrairement aux agents traditionnels basés sur JSON, cette technologie génère directement du code exécutable, ce qui, selon les chercheurs, améliore l’efficacité de 30 % dans l’accomplissement des tâches.

Si Open Deep Research repose pour l’instant sur des modèles d’OpenAI comme GPT-4o, il a été conçu pour fonctionner avec des alternatives open source comme o1 et DeepSeek R1. Hugging Face ne compte pas s’arrêter là : l’équipe prévoit d’intégrer une navigation web avancée, une meilleure gestion des formats de fichiers et travaille déjà sur un clone de l’agent Operator d’OpenAI, capable d’interagir avec des interfaces numériques.

L’ère de l’IA à bas coût approche

Pendant que Hugging Face pousse l’open source dans l’univers des agents autonomes, une autre tendance vient bouleverser l’industrie : la montée en puissance des modèles d’IA low-cost. Des chercheurs de Stanford et de l’Université de Washington ont récemment démontré qu’il était possible de créer un modèle performant pour moins de 50 dollars. Leur système, baptisé s1, rivaliserait avec o1 d’OpenAI et DeepSeek R1, notamment sur les tâches de raisonnement et de codage.

Ce tour de force repose sur une méthode controversée : la distillation, qui consiste à extraire l’essence d’un modèle plus grand pour en créer une version plus compacte et optimisée. Ici, les chercheurs ont utilisé Gemini 2.0 de Google comme base pour entraîner s1 à moindres coûts. L’équipe affirme que ce modèle est non seulement performant, mais qu’il est également plus efficace en matière de calcul, remettant en question la nécessité d’investissements massifs pour le développement d’IA avancées.

Si cette tendance se confirme, elle pourrait mettre en péril le modèle économique des géants de l’IA. OpenAI, Google et Meta misent sur des infrastructures massives et des budgets colossaux pour concevoir des modèles toujours plus puissants. Or, la montée en puissance de solutions low-cost et open source pourrait rebattre les cartes. La startup chinoise DeepSeek l’a déjà prouvé : en proposant une IA de haute qualité à un coût dérisoire, elle a provoqué une chute des actions tech aux États-Unis et mis la pression sur les grandes entreprises.

 

L’affaire Open Deep Research illustre parfaitement cette mutation. En rendant son clone accessible à tous en seulement 24 heures, Hugging Face démontre que l’innovation ne se limite plus aux laboratoires des Big Tech. Désormais, l’open source s’impose comme un contre-pouvoir, capable de démocratiser l’accès aux avancées en intelligence artificielle.

Si cet article vous a plu et si vous envisagez une carrière dans la Data Science ou tout simplement une montée en compétences dans votre domaine, n’hésitez pas à découvrir nos offres de formations ou nos articles de blog sur DataScientest.

Source : huggingface.co

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?