Retour aux articles

ONNX : Vers une interopérabilité standardisée de l’intelligence artificielle

Q: Qu’est-ce que ONNX ?

ONNX est un format ouvert conçu pour représenter des modèles de machine learning et deep learning de manière indépendante des frameworks.

Q: Cas d’usage industriels

ONNX offre plusieurs avantages pratiques, notamment l'interopérabilité entre les équipes de data science et d'ingénierie.

Q: Conclusion

ONNX s’est imposé comme un pilier technique de l’interopérabilité IA.

11 Juin 2025

m de lecture

Intelligence Artificielle

Jérémy Robert

À mesure que les projets d’intelligence artificielle gagnent en complexité, la capacité à transférer et exécuter des modèles sur des environnements variés est devenue essentielle. L’écosystème actuel se caractérise par une multitude de frameworks de développement, chacun avec ses spécificités et formats propriétaires. Dans ce contexte, ONNX (Open Neural Network Exchange) émerge comme une réponse standardisée et open source pour assurer l’interopérabilité entre ces environnements.

Qu’est-ce que ONNX ?

ONNX est un format ouvert conçu pour représenter des modèles de machine learning et deep learning de manière indépendante des frameworks. Il permet aux développeurs d’exporter un modèle entraîné dans un environnement (par exemple, PyTorch ou TensorFlow) et de l’exécuter dans un autre, via un moteur d’inférence compatible comme ONNX Runtime, TensorRT ou OpenVINO.

Développé initialement par Facebook et Microsoft en 2017, ONNX est désormais soutenu par une large communauté industrielle (IBM, Intel, AMD, Qualcomm, etc.) et académique. Ce standard open-source facilite la réutilisation des modèles, accélère le déploiement en production, et renforce la portabilité et l’agilité des systèmes d’intelligence artificielle.

Architecture et composants techniques

Le standard ONNX repose sur trois piliers fondamentaux :

Graphe de calcul extensible
Chaque modèle est représenté sous forme de graphe dirigé acyclique (DAG), où les nœuds correspondent à des opérations et les arêtes aux flux de données. Cela structure les transformations mathématiques à appliquer aux entrées.
Opérateurs standards
ONNX définit un ensemble d’opérateurs (convolution, normalisation, activation, etc.) compatibles entre frameworks. Ces opérateurs assurent un comportement prévisible des modèles transférés, sans avoir besoin de les entraîner une nouvelle fois..
Types de données normalisés
Le format supporte des types standards (float, int, tensor multi-dimensionnel, etc.), garantissant une compatibilité fine avec les moteurs d’exécution.

Axé principalement sur la phase d’inférence (évaluation de modèles déjà entraînés), ONNX optimise la performance sans imposer de contraintes sur l’entraînement.

Ce diagramme synthétise le rôle central de ONNX comme intermédiaire de portabilité entre l’entraînement des modèles IA et leur déploiement sur divers environnements d’exécution.

1. Partie gauche – Entraînement

Le modèle est initialement conçu et entraîné dans l’un des principaux frameworks d’apprentissage automatique ou profond. ONNX permet d’exporter ces modèles dans un format unifié, facilitant ainsi leur réutilisation et leur déploiement sur d’autres plateformes :

PyTorch : très répandu dans la recherche et les environnements académiques, PyTorch séduit par sa flexibilité, son exécution dynamique (eager mode) et son API claire, en faisant un outil de choix pour le prototypage rapide et l’expérimentation.
TensorFlow : largement utilisé dans l’industrie, TensorFlow offre une infrastructure robuste pour le déploiement à grande échelle, le calcul distribué et l’optimisation sur divers matériels, notamment les GPU et TPU.
scikit-learn : référence incontournable pour les modèles de machine learning classiques (régression, arbres de décision, SVM…), scikit-learn est souvent utilisé en phase de prétraitement ou dans des pipelines mêlant statistiques et apprentissage supervisé.

Cette combinaison PyTorch / TensorFlow / scikit-learn couvre une grande majorité des cas d’usage en IA moderne, du prototypage exploratoire à la mise en production industrielle. ONNX joue ici un rôle de trait d’union entre ces écosystèmes.

2. Centre – Format ONNX

Le bloc central ONNX dans le schéma représente un point de convergence technologique essentiel. Il sert de couche d’abstraction universelle, encapsulant le modèle dans un format indépendant de son framework d’origine. Cette portabilité repose sur trois éléments clés : un graphe de calcul structuré en DAG pour une exécution optimisée, un ensemble d’opérateurs standardisés assurant une sémantique cohérente, et des types de données formalisés garantissant la compatibilité matérielle. Ainsi, ONNX offre une représentation interopérable et agnostique, prête à être déployée sur une grande variété de plateformes.

3. Partie droite – Exécution multiplateforme

Une fois exporté, le modèle ONNX peut être déployé sur le cloud, en local, en périphérie ou sur des appareils mobiles. Il s’exécute avec des moteurs d’inférence optimisés comme ONNX Runtime, TensorRT ou OpenVINO, et s’intègre facilement dans des applications développées dans divers langages tels que Python, C++, Java ou JavaScript. Ce découplage entre l’entraînement et l’exécution offre une flexibilité maximale, tout en maintenant des performances élevées grâce aux optimisations propres à chaque backend.

ONNX Runtime : moteur d’exécution optimisé

ONNX Runtime est le moteur officiel d’exécution des modèles ONNX, conçu pour être performant grâce à des optimisations adaptées aux architectures matérielles (CPU, GPU, NPU), polyvalent avec une compatibilité multiplateforme (Windows, Linux, macOS, Android, iOS, web), et multilingue ; accessible via Python, C++, C#, Java, entre autres. Il permet des inférences rapides avec une faible empreinte mémoire, ce qui le rend particulièrement adapté aux environnements de production et aux dispositifs embarqués.

Cas d’usage industriels

ONNX offre plusieurs avantages pratiques, notamment l’interopérabilité entre les équipes de data science et d’ingénierie. Il permet aux chercheurs de développer des modèles en PyTorch, tandis que l’équipe produit peut les intégrer facilement dans des backends optimisés.

Il facilite également le déploiement cross-platform, permettant à un même modèle de s’exécuter sur diverses plateformes comme Azure, AWS, Android, ou même dans des véhicules connectés.

Enfin, ONNX permet une évaluation indépendante des modèles d’IA sur différents moteurs d’inférence, garantissant leur robustesse, stabilité et précision.

Conclusion

ONNX s’est imposé comme un pilier technique de l’interopérabilité IA. Grâce à son format standardisé, il simplifie le passage de la recherche à la production, réduit la dépendance aux outils propriétaires, et favorise la réutilisation des modèles à grande échelle.

Dans un contexte où les architectures IA évoluent rapidement, ONNX constitue un investissement technologique stratégique pour toute organisation cherchant à industrialiser efficacement ses solutions d’intelligence artificielle.

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Poursuivre la lecture

Illustration du musée du Louvre avec la pyramide de verre illuminée se reflétant dans l’eau de nuit.

Comment un simple mot de passe a failli faire tomber le Louvre

Dounia Salmi novembre 5, 2025

Illustration d’un processeur quantique avec un câblage et des circuits complexes, représentant une technologie 64‑qubit avancée.

L’affaire « Kaveri » chez QpiAI : la véritable erreur de feuille de route 64‑qubit qui a secoué l’industrie

Elena MLYNARCZYK novembre 3, 2025

Illustration d’un GPU NVIDIA H100 NVLink, utilisé dans l’infrastructure d'IA et le calcul haute performance.

Microsoft investit 9,7 milliards de dollars dans l’infrastructure d’IA — un accord qui va redéfinir l’échiquier technologique mondial

Elena MLYNARCZYK novembre 3, 2025

Comment l’alliance surprenante d’OpenAI avec AWS pourrait réécrire les règles de la domination technologique

Elena MLYNARCZYK novembre 3, 2025

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

ONNX : Vers une interopérabilité standardisée de l’intelligence artificielle

Qu’est-ce que ONNX ?

Architecture et composants techniques

1. Partie gauche – Entraînement

2. Centre – Format ONNX

3. Partie droite – Exécution multiplateforme

ONNX Runtime : moteur d’exécution optimisé

Cas d’usage industriels

Conclusion

DataScientest News

Comment un simple mot de passe a failli faire tomber le Louvre

L’affaire « Kaveri » chez QpiAI : la véritable erreur de feuille de route 64‑qubit qui a secoué l’industrie

Microsoft investit 9,7 milliards de dollars dans l’infrastructure d’IA — un accord qui va redéfinir l’échiquier technologique mondial

Comment l’alliance surprenante d’OpenAI avec AWS pourrait réécrire les règles de la domination technologique

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

DataNews