Du hast Fragen? Wir haben Antworten! - Bald findet unser nächster Tag der offenen Tür statt!

Logo site

KI trainieren ohne Daten: Mit dieser neuen Technik ist es möglich

-
2
 Minuten Lesezeit
-
ki trainieren

Forscher der Universität Waterloo in Ontario, USA, haben eine neue Technik des Machine Learning mit dem Titel "LO-Shot Learning" entwickelt. Sie ermöglicht es, ein Modell der künstlichen Intelligenz mit nur einer Handvoll Daten zu trainieren,...

Machine Learning oder maschinelles Lernen erfordert heutzutage große Datenmengen. Um eine künstliche Intelligenz zu trainieren, muss sie mit vielen Daten „gefüttert“ werden.

Um zum Beispiel zu lernen, wie man eine Katze erkennt, muss eine KI Tausende von Katzenfotos analysieren. Aus diesem Grund benötigt diese Technologie eine schwere Rechenleistung und ist zeitaufwendig.

Dies ist auch ein wichtiger Unterschied zwischen menschlicher und künstlicher Intelligenz. Denn ein Kind muss nur einige Beispiele eines Gegenstandes sehen, um ihn sein ganzes Leben lang wiedererkennen zu können.

Um diese Kluft zu überbrücken, hat ein Forscherteam der Universität Waterloo in Ontario beschlossen, eine neue Methode zu entwickeln, mit der eine KI mehr Objekte erkennen kann, als die Anzahl der Beispiele, an denen sie trainiert wurde. Diese neue Methode trägt den Titel „less than one-shot learning“ oder „LO-shot learning“.

Für eine Demonstration nutzten die Forscher den MNIST-Datensatz für Computer Vision. Dieser Datensatz enthält über 60.000 Trainingsbilder, die handgeschriebene Zahlen von 0 bis 9 darstellen.

Mithilfe einer kürzlich vom MIT vorgestellten Technik „komprimierten“ die Forscher MNIST in nur zehn Bilder, die so optimiert waren, dass sie die gleiche Menge an Informationen enthielten wie der gesamte Datensatz.

So konnte das Modell, indem es nur mit diesen zehn Bildern trainiert wurde, die gleiche Genauigkeit erreichen, wie wenn es mit dem gesamten Datensatz trainiert worden wäre.

Sie gingen noch einen Schritt weiter, indem sie die Anzahl der Bilder auf fünf reduzierten. Dazu erstellten sie Bilder, die mehrere Zahlen miteinander vermischten. Diese Bilder wurden dann der KI mit „hybriden“ Etiketten zur Verfügung gestellt, die Merkmale erfassen, die von verschiedenen Zahlen geteilt werden.

Beispielsweise weist die Zahl 3 Ähnlichkeiten mit der Zahl 8 auf. Ein Bild kann daher so beschriftet werden, dass es zu 60 % die Zahl 3, zu 30 % die Zahl 8 und zu 10 % die Zahl 0 darstellt.

Source : Université de Waterloo

Machine Learning: LO-Shot Learning ermöglicht kleinen Unternehmen den Zugang zu KI

Nach diesem ersten erfolgreichen Versuch des LO-shot learning versuchten die Forscher, die Grenzen dieser Methode zu finden. Dabei stellten sie fest, dass selbst zwei Beispiele ausreichen können, um eine unbegrenzte Anzahl unterschiedlicher Kategorien zu kodieren.

Um dies zu beweisen, verwendete das Team einen der einfachsten Algorithmen des Machine Learning: die k-nearest neighbor (kNN) Methode. Diese Methode ermöglicht es, Objekte mithilfe eines grafischen Ansatzes zu klassifizieren.

Es wurde eine Reihe von kleinen synthetischen Datensätzen mit hybriden Bezeichnungen erstellt. Der Algorithmus war dann in der Lage, das Schema in mehr Kategorien zu unterteilen, als es Datenpunkte gab.

Source : Université de Waterloo

Dennoch hat das Konzept des LO-shot learning noch einige Schwächen. Während es auf einen visuellen und interpretierbaren Algorithmus wie kNN anwendbar ist, sind neuronale Netze viel komplexer. Daher ist es sehr schwierig, die Etiketten zu entwerfen.

Darüber hinaus erfordert die Methode der Datendestillation einen großen Anfangsdatensatz, der komprimiert werden kann. Jetzt arbeiten die Forscher an einer Technik, die das Engineering dieser synthetischen Data Sets manuell oder mithilfe eines anderen Algorithmus ermöglicht.

Trotz dieser Einschränkungen könnte sich LO-shot learning als sehr nützlich erweisen, um die Rechenleistung, die Zeit und die Datenmenge zu reduzieren, die für das Training von Modellen der künstlichen Intelligenz benötigt werden. Auf diese Weise könnte KI für Unternehmen und Branchen zugänglich werden, die bislang von diesen Anforderungen gebremst wurden.

Du weißt jetzt, was LO-shot Learning ist. Weitere Informationen zum selben Thema findest du in unserem ausführlichen Dossier über Machine Learning und unserem Fokus auf den k-Mittelwert-Algorithmus.

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!
icon newsletter

DataNews

Starte Deine Karriere im Bereich Data: Erhalte regelmäßig Insiderwissen und wertvolle Karrieretipps in Deinem Posteingang.