Word2vec : NLP & Word Embedding

Word Embedding bezeichnet eine Reihe von Lernmethoden, die darauf abzielen, Wörter in einem Text durch Vektoren reeller Zahlen darzustellen.  Heute präsentieren wir dir den dritten Teil unseres NLP-Dossiers. Hast du die ersten Episoden verpasst? Keine Sorge, hier sind sie:   Einführung in NLP   Word embedding – Word2vec   Definition von word embedding   Embedding […]

Künstliche Intelligenz: Zusammenfassung eines Textes mithilfe des TF IDF

Die zahlreichen Fortschritte in NLP ermöglichen es bis heute, es auf zahlreiche Aufgaben anzuwenden: Übersetzung, Texterzeugung, Zusammenfassung … In diesem Artikel wollen wir uns mit einem einfachen Aspekt der Zusammenfassung befassen: der extraktiven Zusammenfassung. Dabei handelt es sich nicht um eine zusammenfassende Zusammenfassung, sondern vielmehr um eine Extraktion der interessantesten, bedeutungstragenden Sätze. Dazu werden wir […]

Transfer Learning: Was ist das?

In diesem fünften und letzten Teil unserer Serie über Deep Learning erfährst du mehr über die Definition und die Funktionsweise von Transfer Learning. Wenn du auf die ersten Artikel zurückgreifen möchtest, findest du hier eine Liste : Einführung in Deep Learning Neuronale Netzwerke: biologisch oder künstlich  Convolutional Neural Network  Funktionsweise von Netzen neuronalen  Transfer Learning […]

Die Funktion SUMMEWENN in Excel: Erklärungen und Beispiele

Die Einsatzmöglichkeiten von Excel reichen von der einfachen Darstellung von Tabellen (Excel-Arbeitsmappen) und Diagrammen bis hin zu anspruchsvollen Berechnungen, bei denen zahlreiche Funktionen mit unterschiedlichen Anwendungen und Komplexitäten (Finanzwesen, Statistik, Mathematik usw.) genutzt werden können. Eine gründliche Beherrschung der Rechen- und Darstellungsmittel von Excel ermöglicht im beruflichen Kontext einen erheblichen Produktivitätsgewinn. Einer der Vorteile und […]

Wie kann man in einer Excel-Zelle zur Zeile gehen?

In einem Excel-Sheet zur Zeile zu springen, ist ganz einfach! Drücke einfach die Eingabetaste auf deiner Tastatur oder wähle mit der Maus die Zelle darunter aus. Aber es ist nicht so einfach, innerhalb einer Zelle zur Zeile zu gehen. Dieses Tutorial soll dir zeigen, wie du in einer Excel-Zelle einen Zeilenumbruch mit zwei verschiedenen Methoden […]

Apache Kafka: Die Plattform zur Verarbeitung von Echtzeitdaten

Apache Kafka ist eine Plattform zur Verarbeitung von Echtzeit-Streaming-Daten. Finde alles heraus, was du wissen musst, um Kafka zu meistern. Die Verarbeitung von Daten per Streaming bietet viele Vorteile. Insbesondere lässt sich auf diese Weise eine Data-Engineering-Architektur effizienter umsetzen. Allerdings sind dafür zusätzliche Technologien erforderlich. Eine dieser Technologien ist Apache Kafka. Was ist Apache Kafka? […]

MLOps: DevOps angewandt auf Machine-Learning-Projekte

In einem früheren Artikel haben wir die DevOps-Philosophie vorgestellt und erläutert, wie dieser neue Ansatz durch die Zusammenführung der bisher in Silos arbeitenden Teams für Entwicklung (Dev) und Betrieb (Ops) eine schnellere Wertschöpfung für Unternehmen ermöglicht. In diesem Artikel beschäftigen wir uns mit der Anwendung dieses Ansatzes auf Machine Learning: MLOps. Zurück zu Devops DevOps […]

Confusion matrix: Was genau ist das und wie wird sie angewendet?

GDie Leistung eines Machine-Learning-Algorithmus steht in direktem Zusammenhang mit seiner Fähigkeit, ein Ergebnis vorherzusagen. Wenn man versucht, die Ergebnisse eines Algorithmus mit der Realität zu vergleichen, verwendet man eine Konfusionsmatrix. In diesem Artikel erfährst du, wie du diese Matrix lesen kannst, um die Ergebnisse eines Klassifikationsalgorithmus zu interpretieren. Was genau ist eine Confusion matrix? Beim […]

Scatter Plot: Definition und Apps

Die Visualisierung von Daten in der Welt der Datenwissenschaft ist heutzutage das Herzstück der Machine-Learning-Pipeline. Die Datenvisualisierung ist somit einer der Schritte in der Datenwissenschaft, der direkt nach dem Sammeln, Bereinigen und Normalisieren der Daten stattfindet. Eine der am häufigsten verwendeten Grafiken ist heutzutage der Scatter-Plot. Mithilfe von Scatterplots können wir Daten analysieren und die […]

ARIMA: Modell zur Vorhersage von Zeitreihen

Wenn du dich schon einmal mit Zeitreihen beschäftigt hast, hast du wahrscheinlich schon von ARIMA oder ARMA gehört. Sie sind die wichtigsten Prozesse, die zur Modellierung von Zeitreihen verwendet werden, und stellen daher eine wichtige Grundlage für den Einstieg in das Thema dar. Wenn du noch nicht weißt, was eine Zeitreihe ist, empfehle ich dir […]

Den t-SNE-Algorithmus in 3 Schritten verstehen

Wenn du dich schon einmal für Methoden zur Dimensionsreduktion interessiert hast, hast du dich wahrscheinlich mit der Hauptkomponentenanalyse oder PCA beschäftigt. In diesem Artikel werden wir uns mit einer der anderen Methoden zur Dimensionsreduktion beschäftigen, die es gibt: t-SNE für t-distributed Stochastic Neighbor Embedding (t-distributed Stochastic Neighbor Embedding). Dieser Algorithmus bietet einen anderen Ansatz als […]

Zeitreihe: Definition, Anwendungen und Analysemethoden

Wir behandeln ein neues Thema mit Daniel, dem technischen Support für die DataScientest-Schulungen. Der Experte für Data Science, der dich durch deine Schulung begleitet. Heute spricht er mit uns über Zeitreihen. Zeitreihen sind eines der am weitesten verbreiteten Studienobjekte der Datenwissenschaft. In diesem Artikel lernst du die Hauptkomponenten einer Zeitreihe kennen. Was ist eine Zeitreihe? […]