Meta stellt die weltweit fortschrittlichste bildgenerierende KI vor, die leistungsfähiger ist als aktuelle Lösungen. CM3Leon benötigt weniger Ressourcen und ist leistungsfähiger.
Eine x-beliebige Bilder-KI?
Man könnte meinen, dass CM3Leon eine weitere künstliche Intelligenz zur Bilderzeugung ist, die sich in die Sammlung von Midjourney, Firefly, Stable Diffusion oder DALL-E einreiht. CM3Leon ist jedoch schneller und sparsamer als seine Konkurrenten, obwohl es 7 Milliarden Parameter besitzt.
Was Leons Effizienz ausmacht, ist seine unterschiedliche Herangehensweise an die Bilderzeugung. Generative KIs verwenden ein generatives neuronales Netz, um nach und nach Elemente von ihrer Datenbank zu subtrahieren, bis sie ein Ergebnis erhalten, das der Anfrage des Nutzers entspricht. Dieser Prozess wird leider als langwierig angesehen und erfordert viel Rechenleistung.
Deshalb verwenden die Meta-Forscher für Leon die „Aufmerksamkeits“-Methode. Durch die Bewertung der Relevanz der Antwortelemente mit der Suchanfrage spart CM3Leon viel Zeit und Rechenleistung. Zusätzlich zu dieser Technik verwendet Leon auch eine „Tuning“-Funktion, die es ihm ermöglicht, das Verständnis der ihm gegebenen Anweisungen zu verfeinern. Da Leon eine modale künstliche Intelligenz ist, kann er auch ein Bild, das man ihm zeigt, beschriften und wird so zu einer Text-zu-Bild- und Bild-zu-Text-KI.
Problematische Bilder?
Trotz der angekündigten Fortschritte wird CM3Leon nicht mit offenen Armen empfangen. Seit einigen Monaten gibt es Skandale um bildgenerierende KIs. Die missbräuchliche Verwendung oder der Diebstahl von Bildern und künstlerischen Arbeiten, um die generativen Modelle zu trainieren, haben zu zahlreichen Prozessen und Geldstrafen gegen Stable Diffusion oder DALL-E geführt.
Angesichts dieses mehr als zweifelhaften Rufs hat sich Meta dafür entschieden, Leon mit lizenzfreien Bildern von Shutterstock zu trainieren. Eine Methode, die auch von Adobe und seiner KI Firefly verwendet wird.
Leon gehört zu den zahlreichen Tools, die Meta seit einigen Monaten zur Verfügung stellt. Dazu gehören Voicebox, eine KI, die die menschliche Stimme nachahmt, oder MusicGen, ein Werkzeug zur Musikproduktion. Das Tool, das jedoch am meisten von sich reden machte, ist LLaMA, eine leistungsstarke Open-Source-LLM, die als Alternative zu GPT dient.
Leon ist noch nicht für die Öffentlichkeit zugänglich und Meta hat kein Datum für seine Veröffentlichung bekannt gegeben.
Im Laufe der Zeit erweitern Daten- und KI-Forscher die Grenzen der neuen Technologien, indem sie die ethischen oder moralischen Probleme identifizieren, die uns obliegen. Und mit dem Ziel, KI ethisch vertretbar zu machen, arbeiten viele Freiberufler und Unternehmen an einer gesunden Technologie. Deshalb, wenn dir dieser Artikel gefallen hat und du eine Karriere in der Data Science in Betracht ziehst, dann zögere nicht, unsere Artikel oder unsere Weiterildungsangebote auf DataScientest zu entdecken.
Quelle: ai.meta.com