🚀 Bist Du bereit für eine Karriere im Bereich Data? Finde es in nur 60 Sekunden heraus!

Hugging Face, das „GitHub für Machine Learning“

-
3
 Minuten Lesezeit
-
hugging face

Hugging Face ist ein Unternehmen, das Open-Source-Bibliotheken mit vorgefertigten Modellen anbietet. Hugging Face ist auf Machine Learning spezialisiert und hat sein Geschäft mit mehreren innovativen, auf KI basierenden Produkten ausgebaut. Heute will das Unternehmen das "GitHub des maschinellen Lernens" werden.

Hugging Face - was ist das?

Hugging Face ist ein französisches Startup, das 2015 von Julien Chaumond und Clément Delangue gegründet wurde. Ihr Ziel: Künstliche Intelligenz für alle zugänglich machen.

Um das zu erreichen, bietet Hugging Face eine Open-Source NLP-Bibliothek (Natural language Processing) an. Das heißt, sie bieten ihren Kunden eine API an, die den Zugriff auf vortrainierte Modelle erleichtert. Da diese Modelle für das maschinelle Lernen bereits trainiert sind, ist es einfacher, sie zu lernen und zu experimentieren. Als Bonus bieten sie auch Werkzeuge für die Verwaltung von Daten und bestehenden Modellen sowie für die Entwicklung und das Training neuer Modelle.

Seit seinen Anfängen ist das Unternehmen exponentiell gewachsen und auf dem besten Weg, zu einem der führenden Anbieter im Bereich der künstlichen Intelligenz zu werden. Im Jahr 2020 wurde es von MIT Technology Review zu einem der innovativsten Unternehmen der Welt ernannt.

Was sind die Lösungen von Hugging Face?

Im Laufe der Jahre hat Hugging Face eine innovative, auf KI basierende Produktreihe entwickelt. Erfahre mehr über die wichtigsten.

Die Transformers-Bibliothek

Um seiner Community bei der Verwaltung und Entwicklung ihrer Machine-Learning-Modelle zu helfen, bietet Hugging Face mehrere Open-Source-Bibliotheken an.

Die bekannteste ist Transformers, eine Bibliothek, die entwickelt wurde, um Python-basierte NLP-Modelle zu trainieren und einzusetzen. Sie können dann eine Vielzahl von Aufgaben im Zusammenhang mit der Verarbeitung natürlicher Sprache durchführen, wie z. B. Klassifizierung, Texterzeugung, Erkennung benannter Entitäten, Informationsgewinnung, Beantwortung von Fragen usw.

Um all diese Aufgaben zu erfüllen, arbeitet Tranformers mit Inferenztraining.

Training ist die traditionelle Methode, die beim maschinellen Lernen verwendet wird. Es genügt, mit Tags versehene Daten zu präsentieren, um das Modell allmählich zu trainieren. Seine Leistung steigt also mit zunehmendem Training.
Mithilfe von Inferenzen können Modelle viel weiter entwickelt werden, da sie durch nicht gekennzeichnete Informationen trainiert werden. Jedes Modell wird für sich selbst lernen (immer auf der Grundlage von im Vorfeld gelernten Referenzen).

Andere Bibliotheken

Neben Transformers bietet Hugging Face auch seine Datasets-Bibliothek an, mit der man auf über 100 NLP-Datensätze zugreifen kann. Oder Tokenizers, die über 40 Sprachen tokenisieren.

Gut zu wissen: Hugging Face bietet auch NLP-Training an. Die Nutzer können sich dann mithilfe all dieser verfügbaren Bibliotheken weiterbilden.

Accelerate

Es handelt sich um eine API, mit der Entwickler und Datenwissenschaftler ihre eigenen Skripte ausführen und ihre eigenen Trainingsschleifen codieren können. Und das in verschiedenen Konfigurationen.

Und um das Erlernen von NLP zu erleichtern, bietet Hugging Face seinen Nutzern auch ein CLI-Tool, mit dem sie Trainingsumgebungen schnell einrichten und testen können.

Spaces

Hugging Face hat sich zu einer echten Gemeinschaftsstrategie entwickelt und bietet auch das Hosting von Modellen an. Genauer gesagt, eine Austauschzone, in der Community-Mitglieder ihre Machine-Learning-Anwendungen teilen.

Sie können dann ihre Apps direkt mit Hugging Face erstellen. Und dank der Versionskontrolle wird die Zusammenarbeit vereinfacht, um noch bessere und innovativere ML-Modelle zu entwerfen.

Chatbots

Hugging Face ist zunächst durch seine Chatbot-Anwendungen bekannt geworden. Daher sollten sie erwähnt werden, auch wenn es sich nicht mehr um ihr Kerngeschäft handelt. Diese wurden mithilfe des Modells des Unternehmens zur Verarbeitung natürlicher Sprache (Hierarchical Multi-Task Learning – HMTL) entwickelt. Zu den verfügbaren Anwendungen gehören Chatty>, Talking Dog, Talking Egg oder Boloss.

Ursprünglich handelte es sich vor allem um Chatbots für Teenager. Aber nach und nach entwickelte sich Hugging Face zu einer Referenz im Bereich des Machine Learning.

Wie sieht die Zukunft von Hugging Face aus?

Hugging hat als einfacher Chatbot für Teenager angefangen, aber ihre Ambitionen gehen heute viel weiter.

Und das aus gutem Grund: Seit ihrer Gründung vervielfachen sie die Anzahl der Finanzierungsrunden.

  • Bereits 2017 sammelten sie 1,2 Millionen US-Dollar im Pre-Seed-Verfahren;
  • Im Jahr 2018 sind es 4 Millionen in Seed;
  • 2019 holt Hugging Face 15 Millionen US-Dollar an Finanzierung für eine Serie A ;
  • Im Jahr 2021 erhöhen sie auf 40 Millionen für eine Serie B und 100 Millionen für eine Serie C.

Aber warum dann überhaupt? Das „GitHub für Machine Learning“ werden und die künstliche Intelligenz demokratisieren. Und das Mindeste, was man sagen kann, ist, dass die Mission erfolgreich ist. Einerseits wird das französische Startup bereits von großen Tech-Namen wie den Teams von Google, Meta, Microsoft oder auch Intel genutzt. Das beweist, dass es bereits jetzt eine Referenz ist.

Andererseits haben Hugging Face und Amazon Web Service ihre Partnerschaft im Februar 2023 bekannt gegeben. Ziel ist es, „die Verfügbarkeit von Machine-Learning-Modellen der nächsten Generation zu beschleunigen, sie für die Community zugänglicher zu machen und Entwicklern zu helfen, bessere Leistung zu geringeren Kosten zu erzielen“.

Erweitere dein Wissen über ML mit DataScientest

Hugging Face möchte die KI demokratisieren, aber Machine Learning erfordert spezielle Fähigkeiten. Daher ist es notwendig, sich weiterzubilden. DataScientest bietet dir die Möglichkeit dazu. Durch unsere Schulungen in Datenwissenschaft oder natürlicher Sprachverarbeitung wirst du alle praktischen und theoretischen Kenntnisse erwerben, um deine eigenen NLP-Modelle zu entwerfen. Komm zu uns!

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!
icon newsletter

DataNews

Starte Deine Karriere im Bereich Data: Erhalte regelmäßig Insiderwissen und wertvolle Karrieretipps in Deinem Posteingang.