🚀 Bist Du bereit für eine Karriere im Bereich Data? Finde es in nur 60 Sekunden heraus!

Zurück zu den Artikeln

MIT-Forscher erstellen ein Computer Vision-Modell, das neunmal besser ist als ältere Generationen

16. September 2023

Minuten Lesezeit

Nachrichten

Wenn ein autonomes Fahrzeug seine Umgebung erkennen möchte, muss es ein Computer-Vision-System verwenden, um jedes Pixel, das von seiner Kamera aufgenommen wird, zu kategorisieren. Diese Segmentierung ist jedoch ein komplexer und rechenintensiver Prozess. Um dieses System zu verbessern, haben Forscher des MIT ein neues Computer Vision-Modell entwickelt, das eine präzise semantische Segmentierung in Echtzeit auf einem Gerät mit begrenzten Hardwareressourcen durchführen kann.

Ein neues Modell der Computervision?

Während ihrer Forschung wollten die MIT-Forscher die Verarbeitung der linearen Berechnung der Spitzenmodelle verbessern und gleichzeitig ihre Fähigkeiten beibehalten. Zu diesem Zweck entwickelten sie eine Reihe neuer Modelle mit dem Namen EfficientViT.

Diese neue Generation wurde als neunmal effizienter als die älteren Modelle bewertet, wobei die gleiche Genauigkeit beibehalten wurde. Die Leistung nahm auch dann nicht ab, wenn das Modell auf einem mobilen Gerät installiert wurde.

Laut den MIT-Teams würden diese neuen Modelle es autonomen Fahrzeugen ermöglichen, Entscheidungen in Echtzeit zu treffen und sich an veränderte Situationen anzupassen. Sie könnten auch zur Verbesserung der Segmentierung medizinischer Bilder und für eine ganze Reihe anderer Aufgaben der Computervision eingesetzt werden.

Welche Unterschiede gibt es zu den Älteren?

Die Forscher haben EfficientViT mit einer hardwaregerechten Architektur entworfen, damit sie leichter auf verschiedenen Arten von Geräten wie Virtual-Reality-Headsets oder Bordcomputern von autonomen Fahrzeugen ausgeführt werden kann.

Um ihre Effizienz zu steigern, ordnete das MIT-Team die Reihenfolge der Operationen neu an, um die Anzahl der erforderlichen Berechnungen zu reduzieren. Um jedoch eine minimale Verarbeitungs- und Bildqualität beizubehalten, fügten sie zwei zusätzliche Recheneinheiten hinzu: Eine hilft den Modellen, die Verbindungen zwischen den Objekten besser zu erkennen, und die andere ermöglicht es den Modellen, sich an die Objekte zu erinnern.

Basierend auf diesen Ergebnissen wollen die Forscher diese Technik anwenden, um generative Modelle des maschinellen Lernens zu beschleunigen, wie z. B. solche, die zur Generierung neuer Bilder verwendet werden. Wenn dir dieser Artikel gefallen hat und du dich für aktuelle Datennachrichten interessierst oder eine Ausbildung in Data Science in Betracht ziehst, dann schau dir unsere Artikel oder unsere Ausbildungsangebote auf DataScientest an.

Quelle: news.mit.edu

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Weiterlesen

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!

Data Analyst

Analytics Engineer

Data Scientist

AI / Machine Learning Engineer

Data Engineer

Cloud Engineer

DevOps Engineer

Data Marketing & AI

MLOps

ETL Entwickler

Data Ops Engineer

Amazon Web Service (AWS)

Microsoft Power BI

Über uns

Karriere

Events

Unsere Alumni

Überblick

Bildungsgutschein

Für Arbeitnehmer

Zurück zu den Artikeln

MIT-Forscher erstellen ein Computer Vision-Modell, das neunmal besser ist als ältere Generationen

Ein neues Modell der Computervision?

Welche Unterschiede gibt es zu den Älteren?

DataScientest News

Weiterlesen

Kill Chain: Was ist das – und wofür wird sie verwendet?

Format elektronische Rechnung: Alles, was Du wissen musst, um nach der Reform konform zu bleiben

Wie Du die richtige HRIS-Software auswählst – Ein praktischer Leitfaden

Elektronische Rechnungsstellung: Die richtigen Tools und Tipps für Deine Auswahl

Möchtest Du informiert bleiben?

Data Analyst

Analytics Engineer

Data Scientist

AI / Machine Learning Engineer

Data Engineer

Cloud Engineer

DevOps Engineer

Data Marketing & AI

MLOps

ETL Entwickler

Data Ops Engineer

Amazon Web Service (AWS)

Microsoft Power BI

Über uns

Karriere

Events

Unsere Alumni

Überblick

Bildungsgutschein

Für Arbeitnehmer

Zurück zu den Artikeln

MIT-Forscher erstellen ein Computer Vision-Modell, das neunmal besser ist als ältere Generationen

Ein neues Modell der Computervision?

Welche Unterschiede gibt es zu den Älteren?

DataScientest News

Weiterlesen

Kill Chain: Was ist das – und wofür wird sie verwendet?

Format elektronische Rechnung: Alles, was Du wissen musst, um nach der Reform konform zu bleiben

Wie Du die richtige HRIS-Software auswählst – Ein praktischer Leitfaden

Elektronische Rechnungsstellung: Die richtigen Tools und Tipps für Deine Auswahl

Möchtest Du informiert bleiben?

DataNews