Noch vor wenigen Jahren stellten Unternehmen, um von Daten zu profitieren, lediglich Data Scientists und Machine Learning-Expert:innen ein.
Diese Fachleute konnten Vorhersagemodelle erstellen, mit denen Unternehmen ihre Arbeitsabläufe automatisieren und wichtige Entscheidungen treffen konnten.
Allerdings scheiterten Machine-Learning-Projekte, wenn sie in Produktion gehen sollten. Unternehmen verpassten Chancen und die Kund:innen waren unzufrieden.
Data Scientists konzentrieren sich ausschließlich auf die Erstellung von Machine-Learning-Modellen. Sobald sie in den Händen der Endnutzer sind, gibt es kein System, das sicherstellt, dass diese Modelle in der realen Welt und in einer anderen Umgebung als der, in der sie trainiert wurden, richtig funktionieren.
Die reale Welt ist jedoch unvorhersehbar und verändert sich ständig. Deshalb kann sich die Leistung eines Machine-Learning-Modells von einem Tag auf den anderen drastisch ändern.
Zum Beispiel kann die kleinste Änderung in der Trainingsdatenbank die Genauigkeit des Modells beeinflussen. Dieses Phänomen wird als „Data Drift“ bezeichnet und muss schnell erkannt werden, um das Modell zu aktualisieren, bevor es verzerrt wird.
Ebenso verursacht die Saisonalität regelmäßige und vorhersehbare Änderungen an den Daten in bestimmten Zeitintervallen. Machine-Learning-Modelle müssen regelmäßig aktualisiert werden, um diese saisonalen Veränderungen zu berücksichtigen.
Außerdem sind viele Machine-Learning-Modelle nicht für die Produktion geeignet, weil sie die großen Datenmengen, die in Echtzeit in das System einfließen, nicht bewältigen können.
Diese Phänomene, die mit fehlenden Verfahren für den Einsatz von Machine-Learning-Modellen zusammenhängen, können einen äußerst negativen Einfluss auf die Leistung der Algorithmen in der Produktion haben. Um dieses Problem zu beheben, wurde der Beruf des MLOps (Machine Learning Operators) ins Leben gerufen.
Ein MLOps verfügt sowohl über Machine-Learning- als auch über Operations-Kenntnisse. Seine Aufgabe ist es, den Workflow zu unterstützen, der auf die Erstellung von Machine-Learning-Modellen folgt.