Zeitreihe Python: Verarbeitung und Modellierung

Eine Zeitreihe ist eine Datentabelle, die die Entwicklung einer Variablen im Laufe der Zeit wiedergibt. In Python wird die Zeitreihe oft in Form einer Pandas-Reihe verarbeitet, die durch ein DateTime indiziert ist. Dieses Format ist sehr einfach zu verarbeiten und zu visualisieren. Zeitreihen werden in vielen Bereichen wie z. B. der Astronomie und der Meteorologie […]
AWS SageMaker: Leitfaden für die Nutzung der Plattform

Amazon SageMaker ist eine von Amazon Web Services (AWS) entwickelte Cloud-Plattform, die besonders für die Data Science nützlich ist. Im Folgenden erfährst Du mehr über die wichtigsten Funktionen und wie Du die Tools der Plattform von der Entwicklung eines Machine-Learning-Modells bis hin zu dessen Einsatz nutzen kannst. Einführung in Amazon SageMaker Amazon SageMaker ist eine […]
Bokeh: Die Python-Bibliothek für Visualisierung der nächsten Generation

Die Datenanalyse bietet viele Möglichkeiten. Allerdings kann es für nicht-technische Benutzer in einem Unternehmen schwierig sein, die Rohdaten zu interpretieren. Indem sie relevante Informationen klar und explizit darstellt, behebt die Data Visualization dieses Problem und ermöglicht es jedem, Big Data zu nutzen.. Wenn du bereits mit Data-Visualization-Bibliotheken wie Matplotlib und/oder Seaborn vertraut bist, werden wir […]
Bayesianische Optimierung: Definition und Funktionsweise

Um ein Vorhersagemodell zu definieren, verwenden Datenwissenschaftler eine Vielzahl von Beobachtungen. Doch während die Untersuchung dieser Beobachtungen zu einem optimalen Ergebnis führt, haben die Datenexperten oft nur wenig Zeit, um alle Hypothesen zu analysieren. Wie kann man also in kürzester Zeit das richtige Modell finden? An dieser Stelle kommt die Bayes’sche oder Bayesianische Optimierung ins […]
Azure Databricks: Was ist das denn?

Azure DataBricks entstand durch die Kombination der Softwares Apache Spark und Databricks, die beide in der Microsoft-Cloud gehostet werden. Damit können Daten in sehr großem Umfang in der Cloud verwaltet werden, wodurch es zahlreiche Möglichkeiten für prädiktive Analysen, künstliche Intelligenz und Echtzeitanwendungen gibt. Was ist Azure Databricks? Azure Databricks ist eine Plattform für Datenanalyse. Sie […]
Apache Cassandra: die beliebteste NoSQL-Bdd.

Apache Cassandra ist eine Open Source NoSQL-Datenbank, die ursprünglich von Facebook für die Speicherung und Analyse von Big Data entwickelt wurde. Hier erfährst Du alles, was Du über dieses unverzichtbare Tool im Bereich Data Science wissen musst. Um die massiven Datenmengen von Big Data speichern und verarbeiten zu können, sind herkömmliche Datenbanken nicht mehr ausreichend. […]
Folium: Entdecke die Open-Source-Bibliothek von Python

Folium ist eine der vielen Open-Source-Zusatzbibliotheken von Python, mit der sich Funktionen erweitern lassen. In diesem Fall ist Folium ein mächtiges Visualisierungswerkzeug, da diese Bibliothek die Gestaltung von interaktiven Karten ermöglicht. Diese Kategorie von Karten ist besonders nützlich, da sie von der Javascript-Bibliothek Leaflet erzeugt werden und daher direkt in Websites eingebunden werden können. Diese Karten […]
Cross-Validation: Bedeutung für Machine Learning

Cross-Validation (Kreuzvalidierungverfahren) ist eine Methode zum Testen der Leistung eines Vorhersagemodells für Machine Learning. Entdecke hier die am häufigsten verwendeten Techniken und wie Du sie beherrschen kannst. Nachdem ein Maschinelles Lernmodell mit gekennzeichneten Daten trainiert wurde, soll es mit neuen Daten arbeiten. Jedoch ist es wichtig, die Genauigkeit der Vorhersagen des trainierten Modells in der Produktion […]
Zusammenhang zwischen Variablen: Wie misst man den Zusammenhangsgrad?

In der Datenwissenschaft ist es entscheidend, herauszufinden und zu quantifizieren, wie stark zwei Variablen zusammenhängen. Diese Beziehungen können komplex sein und sind nicht unbedingt sichtbar. Einige Zusammenhänge schwächen die Leistung von Machine-Learning-Algorithmen wie linearen Regressionen. Daher solltest Du Deine Daten gut vorbereiten. Entdecke unsere Machine Learning-Weiterbildungen Hier werden wir sehen, wie man den Zusammenhang zwischen […]
ELIF Python: Was du bei dieser Funktion beachten solltest

ELIF Python: Das Testen von bedingten Ausdrücken ist die Grundlage der Programmierung. Während die Struktur if then else (wenn dann sonst) den meisten Sprachen innewohnt, manipuliert Python eine andere Form der Bedingung: if elif else… Was genau ist das? Wenn du gelernt hast, ein Computerprogramm zu schreiben, und zwar unabhängig von deinem Niveau, wirst du […]
Die Hybrid Cloud: Was ist das? Wie funktioniert sie?

Das Cloud Computing hat die Art und Weise, wie Unternehmen ihre Daten und Anwendungen verwalten, revolutioniert. Das Aufkommen von Cloud-Infrastrukturen hat es Unternehmen ermöglicht, ihre Daten und Anwendungen effizienter und kostengünstiger als je zuvor zu speichern, zu verarbeiten und darauf zuzugreifen. Allerdings sind nicht alle Unternehmen bereit, alle ihre Daten und Anwendungen in die öffentliche […]
Pearson vs. Spearman Korrelationen: Einfache Erklärung

Korrelation ist ein statistisches Werkzeug, das für Machine Learning verwendet wird, um Abhängigkeitsbeziehungen zwischen mehreren Variablen zu identifizieren. Es gibt verschiedene Arten von Korrelationen. Erfahre unten mehr über die Pearson- und die Spearman-Korrelation. Für die Datenanalyse stehen einem Data Scientist verschiedene statistische Werkzeuge zur Verfügung. Unter diesen Werkzeugen kann er die Korrelation verwenden. Dies ist […]