Das DP-100-Zertifikat ist ein Abschluss, der Fachleuten verliehen wird, die sich in den Bereichen Data Science und Machine Learning (ML) auszeichnen. Das bedeutet, dass sie Lösungen auf Azure trainieren und einsetzen können (Designing and Implementing a Data Science Solution on Azure) und unter anderem Machine-Learning-Workloads auf Azure mit dem Azure ML Service ausführen können. Dazu gehört auch die Fähigkeit, einen relevanten Arbeitsparameter für Data-Science-Workloads auf Azure zu planen und zu generieren.
Voraussetzungen für die DP-100 Examen
Bevor Du die DP-100-Prüfung ablegst, musst Du folgende Kenntnisse beherrschen:
- Grundlagen über Azure-Services
- Erfahrung mit der Programmiersprache Python, um mit Daten zu arbeiten und dabei Bibliotheken wie Numpy, Pandas und Matplotlib zu verwenden.
- Verständnis von Data Science, um zu wissen, wie man Daten aufbereitet und Modelle für maschinelles Lernen mithilfe gängiger ML-Bibliotheken wie Scikit-Learn, PyTorch oder Tensorflow trainiert.
Themen des DP-100 Exam
Die folgenden Bereiche sind die Hauptthemen, in denen das Wissen getestet wird, das für den Erwerb des Microsoft DP-100-Zertifikats erforderlich ist.
1. Einen Azure Machine Learning-Arbeitsbereich einrichten
- Einen Azure Machine Learning-Workspace erstellen (Erstellen eines Azure Machine Learning-Workspace in Azure ML Studio).
Erstellen und Verwalten von Datenbanken und Datensätzen (Speichern von Datenbanken und Erstellen von Datensätzen).
Erstellen von Rechenzielen, die für den Einsatz von ML-Workloads und für Experimente benötigt werden.
2. Durchführung von Experimenten und Modellbildung
- ML-Vorlagen mithilfe des Azure ML-Designers erstellen (eine Microsoft Certified Azure Data Scientist Associate-Pipeline mithilfe eines Designers automatisieren).
- Trainingsskripte in einem Azure ML-Arbeitsbereich ausführen (Erstellen und Ausführen eines Experiments mithilfe des Azure ML SDK, Verwenden von Daten aus einem Datensatz,
- Konfigurieren der Ausführungsparameter eines Skripts usw.).
- Erzeugen von Metriken, Abrufen von Experimentergebnissen und Fehlerbehebung bei der Ausführung eines Experiments (dies umfasst das Abdecken von Protokollmetriken, die aus der Ausführung eines Experiments erzeugt wurden, und das Anzeigen von Experimentausgaben).
3. Optimierung und Verwaltung von Modellen
- Erstellen eines ML-Modells mithilfe des automatisierten Machine
- Learning von Azure ML Studio und des Azure ML SDK.
- Die Hyperparameter mithilfe von Hyperdrive einstellen (Festlegung der Werte der Hyperparameter für das Modell, Auswahl der Stichprobenverfahren usw.).
- Interpretiere jedes Modell und generiere Daten nach Wichtigkeit ihrer Eigenschaften (Auswahl eines Modell- und Dateninterpreters).
- Das Modell aufzeichnen und überwachen, um einen Datendrift zu vermeiden (Aufzeichnung des trainierten Modells und Überwachung der Daten auf Drift).
4. Einsatz und Verwendung von ML-Vorlagen
- Erstelle Berechnungsziele für die Produktion (achte auf die Sicherheit für die eingesetzten Dienste und die Bewertung der Berechnungsoptionen).
- Das ML-Modell als Dienst bereitstellen (Konfiguration der Bereitstellungsparameter, Nutzung der bereitgestellten Dienste usw.).
- Erstellen und Ausführen einer Batch-Inferenz-Pipeline (Erstellen einer Batch-Inferenz-Pipeline und Erzielen von Ausgaben.
- Eine Designer-Pipeline als Webservice bereitstellen (Erstellen einer Berechnungszielressource und Verwendung des bereitgestellten Endpunkts).