Zurück zu den Artikeln

Was ist die Grad CAM-Methode?

23. Juli 2023

Minuten Lesezeit

Data Science

In den letzten Jahren war die Erklärbarkeit ein wiederkehrendes, aber immer noch ein Nischenthema im maschinellen Lernen. Die Grad-CAM-Methode ist eine Lösung, um dieses Problem anzugehen.

In jüngerer Zeit hat das Interesse an diesem Thema begonnen, sich zu beschleunigen. Ein Grund dafür: die wachsende Zahl von Modellen des maschinellen Lernens in der Produktion. Das führt einerseits zu einer wachsenden Zahl von Endnutzern, die verstehen müssen, wie die Modelle ihre Entscheidungen treffen. Andererseits muss eine wachsende Zahl von Machine-Learning-Entwicklern verstehen, warum (oder warum nicht) ein Modell auf eine bestimmte Weise funktioniert.

Faltende neuronale Netze haben sich bei Aufgaben wie der Klassifizierung von Bildern, der Gesichtserkennung und der Dokumentenanalyse als sehr effektiv erwiesen. Mit zunehmender Effizienz und Komplexität ist jedoch eine allmähliche Abnahme der Interpretierbarkeit dieser Algorithmen zu beobachten.

Eine Lösung für Probleme wie die Gesichtserkennung beinhaltet Hunderte von Schichten und Tausende von Parametern, die trainiert werden müssen, was es schwierig macht, das Modell zu lesen, zu debuggen und ihm zu vertrauen. CNNs erscheinen wie Black Boxes, die mit großer Genauigkeit Eingaben nehmen und Ausgaben liefern, ohne Einblicke in die Funktionsweise zu geben.

Als Datenwissenschaftler liegt es in unserer Verantwortung, sicherzustellen, dass das Modell richtig funktioniert. Angenommen, wir erhalten die Aufgabe, verschiedene Vögel zu klassifizieren. Der Datensatz enthält Bilder von verschiedenen Vögeln und von Pflanzen/Bäumen im Hintergrund. Wenn das Netzwerk statt auf den Vogel auf die Pflanzen und Bäume schaut, ist die Wahrscheinlichkeit groß, dass es das Bild falsch einordnet und alle Merkmale des Vogels übersieht. Wie können wir feststellen, ob unser Modell auf das Richtige schaut? In diesem Artikel werden wir einen Ansatz sehen, um zu erkennen, ob das CNN mit den Merkmalen, die für die Klassifizierung oder Erkennung wichtig sind, richtig arbeitet.

💡Auch interessant:

Data Poisoning

Machine Learning Data Sets Top 5

Die Top 3 Machine Learning Algorithmen

Aversarial Examples im Machine Learning

Microsoft Azure Kurs Machine Learning

Die Grad-CAM-Methode

Eine Möglichkeit, dies sicherzustellen, besteht darin, mithilfe der Grad CAM-Methode zu visualisieren, was die NKAs tatsächlich betrachten.

Die gradientengewichtete Klassenaktivierungskarte (Grad-CAM) erzeugt eine Heatmap, die wichtige Regionen in einem Bild hervorhebt, indem sie die Zielgradienten (Hund, Katze) der endgültigen Faltungsschicht verwendet.

Die Grad CAM-Methode ist eine beliebte Visualisierungstechnik, die nützlich ist, um zu verstehen, wie ein gefaltetes neuronales Netz dazu gebracht wurde, eine Klassifizierungsentscheidung zu treffen. Sie ist klassenspezifisch, was bedeutet, dass sie für jede im Bild vorhandene Klasse eine eigene Visualisierung erzeugen kann.

Im Falle eines Klassifikationsfehlers kann diese Methode sehr hilfreich sein, um zu verstehen, wo das Problem im Faltungsnetz liegt. Außerdem wird der Algorithmus dadurch transparenter.

Wie funktioniert das?

Grad-CAM besteht darin, zu suchen, welche Teile des Bildes ein faltendes neuronales Netz zu seiner endgültigen Entscheidung geführt haben. Bei dieser Methode werden Heatmaps erstellt, die die Aktivierungsklassen auf den als Eingabe erhaltenen Bildern darstellen.

Eine Aktivierungsklasse ist mit einer bestimmten Ausgabeklasse verbunden.
Diese Klassen werden die Bedeutung jedes Pixels in Bezug auf die jeweilige Klasse anzeigen, indem die Intensität des Pixels erhöht oder verringert wird.
Wenn z. B. ein Bild in einem Faltungsnetzwerk von Hunden und Katzen verwendet wird, kann die Grad CAM-Anzeige eine Heatmap für die Klasse „Katze“ erzeugen, die anzeigt, inwieweit die verschiedenen Teile des Bildes einer Katze entsprechen, und auch eine Heatmap für die Klasse „Hund“, die anzeigt, inwieweit die Teile des Bildes einem Hund entsprechen.
Betrachten wir zum Beispiel eine CNN von Hunden und Katzen. Die Grad-CAM-Methode wird eine Heatmap (Wärmekarte) für die Objektklasse Katze erzeugen, die anzeigt, inwieweit die einzelnen Teile eines Bildes einer Katze entsprechen, und ebenso eine Heatmap für die Objektklasse Hund, indem sie auf die gleiche Weise vorgeht.
Die Klassenaktivierungskarte weist jeder Position (x, y) in der letzten Faltungsebene eine Wichtigkeit zu, indem die Linearkombination der Aktivierungen berechnet wird, gewichtet mit den entsprechenden Ausgabegewichten für die beobachtete Klasse (Australian Terrier im folgenden Beispiel). Das resultierende Klassenaktivierungs-Mapping wird dann wieder auf die Größe des Eingabebildes skaliert. Dies wird durch die folgende Heatmap veranschaulicht.

Betrachten wir nun wieder das Beispiel der Klassifizierung von Hunden und Katzen. Die Grad-CAM-Methode wird also die Bereiche, die für die Klassifizierung jedes Objekts in unserem Bild verwendet werden, thermisch darstellen und das wird zu folgendem Ergebnis führen:

In diesem Artikel haben wir eine neue Technik zur Interpretation von gefalteten neuronalen Netzen gesehen, die eine hochmoderne Architektur darstellen, insbesondere für bildbezogene Aufgaben. Die Forschung auf dem Gebiet des interpretierbaren maschinellen Lernens schreitet immer schneller voran und ist sehr wichtig, um das Vertrauen der Nutzer zu gewinnen und zur Verbesserung der Modelle beizutragen.

Hat dir dieser Artikel gefallen? Wenn du von der Bedeutung des Machine Learning heutzutage und von der Effektivität unseres Bootcamp-Trainings überzeugt bist

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Weiterlesen

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!

Data Analyst

Analytics Engineer

Data Scientist

AI / Machine Learning Engineer

Data Engineer

Cloud Engineer

DevOps Engineer

MLOps

ETL Entwickler

Data Ops Engineer

Studentenkurse

Amazon Web Service (AWS)

Microsoft Power BI

Über uns

Karriere

Events

Unsere Alumni

Bildungsgutschein

Qualifizierungs-chancengesetz

Finanzierung

Zurück zu den Artikeln

Was ist die Grad CAM-Methode?