🚀 Bist Du bereit für eine Karriere im Bereich Data? Finde es in nur 60 Sekunden heraus!

Data Analysis oder Datenanalyse

Datenanalyse also Data Analysis, wird immer häufiger in Unternehmen aller Branchen eingesetzt. Hier erfährst Du alles, was Du darüber wissen musst. Dank digitaler Technologien haben Unternehmen heute Zugang zu große Mengen an Daten. Diese Informationen verstehen und analysieren zu wissen, ist von großem Vorteil. Data Analysis (Datenanalyse) ist ein Prozess, bei dem Daten bereinigt, umgewandelt […]

Sharding: Definition, User, Vor- und Nachteile

Das Wort „sharding“ bedeutet im Englischen „aufspalten“. In der Data Science ist Sharding eine Methode, um einen Datensatz aus einer Datenbank zu partitionieren. Man teilt die Datenbank in mehrere Datensätze auf, die auch als „Datasets“ bezeichnet werden. Was genau ist Sharding? Es gibt zwei Hauptmethoden des Sharding oder der Partitionierung: die horizontale und die vertikale […]

Die Brownsche Bewegung: Prinzip und praktische Anwendungen

Nehmen wir ein mikrometergroßes Teilchen, das in einer Flüssigkeit schwimmt. Andere kleinere Teilchen stoßen auf dieses „größere“ Teilchen, sodass es eine zufällige Bewegung hat. Das Prinzip der Brownschen Bewegung wird auch als Wiener-Prozess bezeichnet. Historisch gesehen entdeckte der Botaniker Robert Brown die Brownsche Bewegung im Jahr 1827. Er beobachtete die chaotische Bewegung von Pollenkörnern in […]

MapReduce: Wie lässt es sich für Big Data nutzen?

MapReduce ist das Programmiermodell des Hadoop-Frameworks. Es ermöglicht die Analyse riesiger Mengen von Big Data durch parallele Verarbeitung. Hier erfährst Du alles, was Du wissen musst: Einführung, Funktionsweise, Alternativen, Vorteile, Weiterbildungen… Die riesigen Mengen in Zeiten von Big Data bieten zahlreiche Chancen für Unternehmen. Allerdings kann es schwierig sein, diese Daten mit herkömmlichen Systemen schnell […]

Kaggle: Alles, was Du über diese Plattform wissen musst

Wenn Du Dich seit einiger Zeit mit Data Science beschäftigst, hast Du sicher schon von Kaggle gehört. Heute erläutern wir, was Kaggle ist und warum dieses Tool ein Muss in der Welt der Data Science geworden ist! Was ist Kaggle? Kaggle ist ein Webportal, das die weltweit größte Data-Science-Community mit über 536.000 aktiven Mitgliedern in […]

Hadoop: Was ist das und was sind die Lerntipps?

Hadoop ist ein Open-Source-Framework für Speicherung und Verarbeitung von Big Data. Hier erfährst Du alles, was Du wissen musst: Definition, Geschichte, Funktionsweise, Vorteile, Weiterbildungen… Mehrere Jahrzehnte lang speicherten Unternehmen ihre Daten hauptsächlich in relationalen Datenbanken (RDBMS), um sie zu speichern und Abfragen durchzuführen. Diese Art von Datenbank kann jedoch weder unstrukturierte Daten speichern, noch ist […]

Algorithmus: Was ist das? Wozu dient er?

Algorithmen sind in der Informatik und insbesondere in der Data Science und im Machine Learning von entscheidender Bedeutung. Hier erfährst Du alles, was Du über einen Algorithmus wissen musst: Definition, Funktionsweise, Anwendungen, mögliche Bildungswege… Algorithmen sind bereits im Bereich der Computerprogrammierung sehr wichtig und werden in Zeiten von Big Data und künstlicher Intelligenz immer wichtiger. […]

DAX Power BI: Alles über die Programmiersprache für Queries

power bi

DAX Power BI: Die Power BI-Plattform von Microsoft ist auf Business Intelligence, Datenanalyse und Data Visualization ausgerichtet. Dieses Software-Tool ermöglicht es, Echtzeitanalysen in Form von Visualisierungen zu nutzen. Die Nutzung ist sehr intuitiv, aber es ist häufig notwendig, Formeln und Ausdrücke zu erstellen, um die Daten zu analysieren. Hierfür wird DAX verwendet. Die Sprache DAX […]

Python Schulung: Wieso Du jetzt loslegen solltest

python

Python Schulung: Viele Online-Kurse für Webentwicklung und Data Science bieten als ersten Schritt einen Python-Kurs an. Python ist eine intuitive und vielseitige Programmiersprache, die ideal für Anfänger ist. Python ist eine Open-Source-Programmiersprache, die 1991 entwickelt wurde.  Im Laufe der Zeit ist sie bei Anwendungs- und Webentwicklern immer beliebter geworden. Python ist eine objektorientierte Programmiersprache, d. […]

Power BI Dataflow: Alles über das Self-Service-ETL-Tool

dataflow

Das Power BI Dataflow Tool ist ein Self-Service-Tool zur Datenintegration für die Business Intelligence-Plattform von Microsoft. Erfahre, wie Dataflow funktioniert und wie du lernen kannst, es zu benutzen. Die Evolution der Datenintegration Traditionell wurde ein separates ETL-Tool verwendet, um Daten für die spätere Verwendung vorzubereiten. Power BI änderte diese Dynamik, indem es eine direkte Verbindung […]

Apache Spark: Was ist das und wozu dient es?

Apache Spark ist eine einheitliche, ultraschnelle Analyse-Engine für die Verarbeitung großer Datenmengen. Sie ermöglicht es, große Analysen mithilfe von Clustermaschinen durchzuführen. Sie ist vor allem auf Big Data und Machine Learning ausgerichtet. Was ist Apache Spark? Für alle, die neugierig sind, werfen wir einen Blick zurück auf die Entstehung von Apache Spark! Alles beginnt im […]

PyTorch: Alles über den Deep Learning Framework von Facebook

Da Python eine der am häufigsten verwendeten Programmierprachen ist, gibt es eine Vielzahl von Frameworks, von denen viele ausschließlich für Data Science entwickelt wurden. In diesem Artikel werden wir Ihnen einen dieser Frameworks näher vorstellen: PyTorch Die Beliebtheit der Data Science hat in den letzten Jahren stetig zugenommen, was zu einer Explosion der Ressourcen für […]