ONNX ist ein offenes Format, das entwickelt wurde, um Machine Learning und Deep Learning Modelle unabhängig von den Frameworks zu repräsentieren.

ONNX Runtime: optimierter Ausführungsmotor

ONNX Runtime ist der offizielle Ausführungsmotor für ONNX-Modelle mit Optimierungen für CPU, GPU, NPU und Multi-Plattform-Kompatibilität.

Zurück zu den Artikeln

ONNX: Der offene Standard für portable KI-Modelle

Q: Architektur und technische Komponenten

Der ONNX-Standard basiert auf einem DAG-Berechnungsgraphen, standardisierten Operatoren und normalisierten Datentypen.

Q: Industrielle Anwendungsfälle

ONNX erleichtert die Interoperabilität, plattformübergreifende Bereitstellung und unabhängige Bewertung von KI-Modellen in der Industrie.

9. Juli 2025

Minuten Lesezeit

Künstliche Intelligenz

Mit wachsender Komplexität der KI-Projekte gewinnt die Fähigkeit an Bedeutung, Modelle flexibel zu übertragen und in verschiedenen Umgebungen auszuführen.
Das heutige Ökosystem umfasst zahlreiche Entwicklungsframeworks – jedes mit eigenen Besonderheiten und proprietären Formaten. ONNX (Open Neural Network Exchange) schafft hier Abhilfe: Als quelloffener Standard erleichtert es die Interoperabilität und verbindet die unterschiedlichen Systeme reibungslos.

Was ist ONNX?

ONNX ist ein offenes Austauschformat, das speziell dafür entwickelt wurde, Machine-Learning- und Deep-Learning-Modelle frameworkunabhängig zu speichern und weiterzugeben. So kannst Du ein trainiertes Modell beispielsweise in PyTorch oder TensorFlow entwickeln, es anschließend im ONNX-Format exportieren und dann mit einem anderen Tool – etwa ONNX Runtime, TensorRT oder OpenVINO – für die Inferenz verwenden.

Facebook und Microsoft entwickelten ONNX im Jahr 2017. Heute unterstützen viele Unternehmen (darunter IBM, Intel, AMD, Qualcomm) sowie die Forschungsgemeinschaft dieses Open-Source-Projekt. Es erleichtert die Wiederverwendung von Modellen, beschleunigt den Schritt in die Produktion und erhöht die Flexibilität von KI-Systemen.

Durch diese breite Unterstützung und die Offenheit des Standards ermöglicht ONNX eine bessere Wiederverwendbarkeit von Modellen, verkürzt die Zeit bis zur Produktionsreife und steigert insgesamt die Portabilität und Flexibilität von KI-Systemen.

Architektur und technische Komponenten

Die Architektur von ONNX basiert auf drei zentralen technischen Säulen, die zusammen eine reibungslose Portabilität von KI-Modellen ermöglichen.

1. Erweiterbarer Berechnungsgraph
Es bildet jedes Modell als gerichteten azyklischen Graphen (DAG) ab. Dabei stehen die Knoten für Operationen, die Kanten für Datenflüsse. So strukturiert ONNX die mathematischen Transformationen nachvollziehbar.

2. Standardisierte Operatoren
ONNX definiert einheitliche Operatoren wie Konvolution, Aktivierung oder Normalisierung. Diese sorgen dafür, dass Modelle unabhängig vom ursprünglichen Framework korrekt funktionieren – ohne erneutes Training.

3. Normalisierte Datentypen
Außerdem unterstützt ONNX eine Vielzahl standardisierter Datentypen – von einfachen Ganzzahlen und Fließkommazahlen bis hin zu mehrdimensionalen Tensors. Das garantiert eine hohe Kompatibilität mit diversen Inferenz-Engines und erleichtert die Integration in unterschiedliche technische Umgebungen.

ONNX konzentriert sich auf die Inferenzphase, also die Ausführung bereits trainierter Modelle. Dabei erzielt es hohe Leistung, ohne die Trainingsumgebung einzuschränken.

Der Workflow im Überblick

Das folgende gedankliche Schema beschreibt die Rolle von ONNX als Bindeglied zwischen Modelltraining und plattformübergreifender Ausführung.

1. Training im Ursprungsframework

Im ersten Schritt wird das Modell in einem der gängigen Frameworks für maschinelles oder tiefes Lernen entwickelt und trainiert:

PyTorch eignet sich besonders für Forschung und schnelles Prototyping dank seiner dynamischen Ausführung und einfachen API.
TensorFlow punktet in der Industrie mit stabiler Skalierbarkeit, verteilter Verarbeitung und Hardware-Optimierung – insbesondere für GPUs oder TPUs.
scikit-learn ist weit verbreitet im klassischen Machine Learning und kommt oft in Vorverarbeitungsschritten oder in analytischen Pipelines zum Einsatz.

All diese Frameworks decken in Kombination eine große Bandbreite an realen Anwendungsfällen ab – und ONNX dient dabei als Brücke zwischen ihnen.

2. Ein Standardformat

Nach dem Training wird das Modell ins ONNX-Format exportiert. Dieses Format agiert als neutrale Zwischenschicht, die das Modell unabhängig von seinem Ursprung präsentiert. Es kombiniert drei zentrale Eigenschaften: einen strukturierten DAG für eine effiziente Ausführung, standardisierte Operatoren für semantische Konsistenz und formalisierte Datentypen für maximale Kompatibilität mit unterschiedlichen Hardware-Setups.

3. Ausführung auf beliebiger Plattform

Sobald das Modell im ONNX-Format vorliegt, kann es flexibel bereitgestellt werden – sei es lokal, in der Cloud, am Edge oder auf mobilen Endgeräten. Mit Inferenz-Engines wie ONNX Runtime, TensorRT oder OpenVINO lässt sich das Modell hochperformant ausführen. Zudem ist die Integration in bestehende Softwareprojekte problemlos möglich, da ONNX-Modelle mit verschiedenen Programmiersprachen wie Python, C++, Java oder JavaScript genutzt werden können.

Insgesamt entkoppelt ONNX damit das Training vom Deployment und sorgt für maximale Flexibilität – bei gleichzeitig hoher Effizienz und plattformübergreifender Kompatibilität.

ONNX Runtime: Der optimierte Ausführungsmotor

ONNX Runtime führt ONNX-Modelle besonders schnell und effizient aus. Es nutzt gezielte Optimierungen für verschiedene Hardwarearchitekturen – ob CPU, GPU oder NPU. Dank seiner Plattformunabhängigkeit funktioniert es reibungslos unter Windows, Linux, macOS, Android, iOS und im Web. Entwickler greifen über Sprachen wie Python, C++, C# oder Java darauf zu. Durch den geringen Speicherverbrauch eignet sich ONNX Runtime ideal für den produktiven Einsatz und für eingebettete Systeme.

Industrielle Anwendungsfälle

ONNX bringt Teams aus Forschung und Entwicklung näher zusammen. Während Data Scientists ein Modell beispielsweise in PyTorch entwickeln, kann das Engineering-Team es problemlos in produktionsreife Infrastrukturen integrieren.

Auch die Bereitstellung auf mehreren Plattformen gelingt ohne Mehraufwand – sei es auf Azure, AWS, mobilen Geräten oder direkt im vernetzten Fahrzeug. ONNX erlaubt eine flexible und effiziente Nutzung derselben Modelle in unterschiedlichsten Umgebungen.

Zudem lässt sich die Qualität eines Modells auf mehreren Inferenz-Engines vergleichen. So können Unternehmen die Stabilität, Genauigkeit und Robustheit ihrer KI-Anwendungen objektiv bewerten.

Schlussfolgerung

ONNX treibt die Interoperabilität in der KI-Welt entscheidend voran. Es verbindet verschiedene Frameworks durch ein standardisiertes Format, vereinfacht die Übertragung von Modellen aus der Forschung in die Produktion und senkt gleichzeitig die Abhängigkeit von proprietären Lösungen.

Wer KI-Projekte zuverlässig skalieren will, findet hier ein leistungsstarkes Werkzeug. Es hilft dabei, Entwicklungsprozesse zu beschleunigen, Modelle wiederzuverwenden und neue KI-Anwendungen schneller bereitzustellen – plattformübergreifend und zukunftssicher.

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Weiterlesen

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!

Data Analyst

Analytics Engineer

Data Scientist

AI / Machine Learning Engineer

Data Engineer

Cloud Engineer

DevOps Engineer

Data Marketing & AI

MLOps

ETL Entwickler

Data Ops Engineer

Amazon Web Service (AWS)

Microsoft Power BI

Über uns

Karriere

Events

Unsere Alumni

Überblick

Bildungsgutschein

Für Arbeitnehmer

Zurück zu den Artikeln

ONNX: Der offene Standard für portable KI-Modelle

Was ist ONNX?

Architektur und technische Komponenten