Azure Databricks: Was ist das denn?
Azure DataBricks entstand durch die Kombination der Softwares Apache Spark und Databricks, die beide in der Microsoft-Cloud gehostet werden. Damit können Daten in sehr großem Umfang in der Cloud verwaltet werden, wodurch es zahlreiche Möglichkeiten für prädiktive Analysen, künstliche Intelligenz und Echtzeitanwendungen gibt. Was ist Azure Databricks? Azure Databricks ist eine Plattform für Datenanalyse. Sie […]
Apache Cassandra: die beliebteste NoSQL-Bdd.
Apache Cassandra ist eine Open Source NoSQL-Datenbank, die ursprünglich von Facebook für die Speicherung und Analyse von Big Data entwickelt wurde. Hier erfährst Du alles, was Du über dieses unverzichtbare Tool im Bereich Data Science wissen musst. Um die massiven Datenmengen von Big Data speichern und verarbeiten zu können, sind herkömmliche Datenbanken nicht mehr ausreichend. […]
Folium: Entdecke die Open-Source-Bibliothek von Python
Folium ist eine der vielen Open-Source-Zusatzbibliotheken von Python, mit der sich Funktionen erweitern lassen. In diesem Fall ist Folium ein mächtiges Visualisierungswerkzeug, da diese Bibliothek die Gestaltung von interaktiven Karten ermöglicht. Diese Kategorie von Karten ist besonders nützlich, da sie von der Javascript-Bibliothek Leaflet erzeugt werden und daher direkt in Websites eingebunden werden können. Diese Karten […]
Cross-Validation: Bedeutung für Machine Learning
Cross-Validation (Kreuzvalidierungverfahren) ist eine Methode zum Testen der Leistung eines Vorhersagemodells für Machine Learning. Entdecke hier die am häufigsten verwendeten Techniken und wie Du sie beherrschen kannst. Nachdem ein Maschinelles Lernmodell mit gekennzeichneten Daten trainiert wurde, soll es mit neuen Daten arbeiten. Jedoch ist es wichtig, die Genauigkeit der Vorhersagen des trainierten Modells in der Produktion […]
Zusammenhang zwischen Variablen: Wie misst man den Zusammenhangsgrad?
In der Datenwissenschaft ist es entscheidend, herauszufinden und zu quantifizieren, wie stark zwei Variablen zusammenhängen. Diese Beziehungen können komplex sein und sind nicht unbedingt sichtbar. Einige Zusammenhänge schwächen die Leistung von Machine-Learning-Algorithmen wie linearen Regressionen. Daher solltest Du Deine Daten gut vorbereiten. Entdecke unsere Machine Learning-Weiterbildungen Hier werden wir sehen, wie man den Zusammenhang zwischen […]
Power BI Schulung in Berlin: Mit uns möglich!
Du wohnst in Berlin und genießt die Hauptstadt an der Spree? Du isst gern einen Berliner Döner oder eine Berliner Currywurst auf der Insel der Jugend? Kurzum: Du willst hier nicht weg, aber du willst trotzdem Karriere im Bereich Data Science machen und das Power BI Tool erlernen? Ja, das geht! Mit unseren Schulungen, die […]
Data Scientist vs. Data Analyst: Welche Unterschiede gibt es?
Data Scientist vs. Data Analyst: Entdecke alle Unterschiede zwischen diesen beiden Schlüsselpositionen im Bereich Data Science. Aufgaben, Kompetenzen, Gehalt, Ausbildung etc. Hier findest Du einen ausführlichen Vergleich zwischen diesen beiden Berufen im Bereich Big Data. Die Berufe Data Scientist und Data Analyst gehören zu den gefragtesten im Bereich Big Data und Data Science. Allerdings werden […]
Datenkapselung: Definition und Bedeutung
Die Datenkapselung (engl. encapsulation) ist ein wichtiges Konzept in der objektorientierten Programmierung. Hier erfährst Du alles, was Du wissen solltest. Datenkapselung ist ein Mechanismus, bei dem Daten und Methoden in einer Struktur zusammengefasst sind. Dabei wird die Implementierung des Objekts verborgen: Man kann auf die Daten nur über die festgelegten Zugriffsfunktionen zugreifen. Durch die Datenkapselung […]
Data Engineer: Aufgaben, Fähigkeiten, Gehalt und Karrierechancen im Überblick
Data Engineers bzw. Dateningenieure und Dateningenieurinnen haben die Aufgabe, die Daten so aufzubereiten, dass die Data Scientists sie analysieren können. Hier erfährst Du alles, was Du über diesen Beruf im Bereich Big Data wissen solltest. Big Data und Data Science entwickeln sich ständig weiter und immer mehr Berufe entstehen in diesem Bereich. Heute möchten wir […]
Power BI Mobile: Alles über die mobile Version von Power BI
Power BI Mobile ist die mobile Version der Business-Intelligence-Plattform von Microsoft. Diese App ist für iOS-, Android- und Windows-Smartphones und -Tablets verfügbar. Hier erfährst du alles, was du über dieses Tool wissen musst und wie du lernst, es zu benutzen. Im Zeitalter von Big Data ist es für Unternehmen unerlässlich, Daten zu aggregieren und ständig […]
Power BI Waterfall Visual: Anwendungsbeispiele
Das Power BI Waterfall Visual ist eine Art DataViz, mit dem du die Veränderungen zwischen einem Anfangswert und einem Endwert visualisieren kannst. Hier erfährst du alles, was du über dieses Diagramm wissen musst: Präsentation, Vorteile, Tutorial, Training… Um Daten zu visualisieren, eignen sich Balken- und Säulendiagramme für einen Anfangs- oder Endwert. Diese Art von Diagramm […]
cuML: Definition und Verwendung in Machine Learning
Wenn wir es mit großen Datenbeständen mit enorm vielen Beobachtungen und komplexen Machine-Learning-Modellen mit vielen Hyperparametern zu tun haben, kann der Trainingsschritt mehrere Stunden dauern. In diesem Fall entsteht eine inverse Beziehung zwischen der Anzahl der Daten und der Leistung des Modells. Um also diese verlorene Zeit, die durch das Warten auf die Ausführung der […]