Amazon EMR: Ein von AWS verwaltetes Tool zur Verwaltung von Clustern

Amazon EMR (Elastic MapReduce) ist ein Datenverarbeitungsdienst, der von Amazon Web Service (AWS) verwaltet wird. Er verwaltet große Datenmengen im Petabyte-Bereich mithilfe beliebter Tools wie Apache Hadoop, Hive, Spark und HBase, um nur einige zu nennen. Amazon EMR wurde so konzipiert, dass es eine hohe Flexibilität und Skalierbarkeit bietet, die es den Nutzern ermöglicht, sehr […]
AWS Glue: Was ist das? Wozu dient es?

AWS Glue ist ein vollständig verwalteter und skalierbarer Datenverarbeitungsdienst, der es den Nutzern ermöglicht, serverlose ETL-Workflows (Extract, Transform, Load) zu verwenden und so den gesamten Verwaltungsteil der zugrunde liegenden Infrastruktur zu umgehen. Erinnerung an ETL-Prozesse ETL ist ein Prozess, der darauf abzielt, die Qualität und Verfügbarkeit der Daten zu gewährleisten. Er ist in drei Phasen […]
COBOL: Alles über die Datenverwaltungssprache

COBOL (Common Business-Oriented Language) ist eine Programmiersprache, die in den 1950er Jahren für Geschäfts- und Verwaltungsanwendungen entwickelt wurde und auch heute noch häufig für die Verwaltung von Datenbanken verwendet wird. Hier erfährst du alles, was du wissen musst! Ab den 1950er Jahren, mit dem Aufkommen der Wirtschaftsinformatik, begannen Unternehmen, Computer in großem Umfang zur Verarbeitung […]
SBT in Scala

In diesem Artikel stellen wir dir ein Entwicklungswerkzeug für deine Scala-Projekte vor. Es handelt sich dabei um SBT, das für „Simple Build Tool“ steht. SBT Scala ist ein Open-Source-Baukasten, der die Verwaltung deiner Projekte vereinfacht. Es ermöglicht dir, deine Abhängigkeiten zu verwalten, deine JAR-Dateien zu kompilieren, auszuführen und zu verteilen. Lass uns einen genaueren Blick […]
Blue Green Deployment: Das Prinzip im Devop

Blue Green Deployment: Mit der Entwicklung der DevOps-Kultur tauchen auch neue Konzepte auf. Dies gilt insbesondere für den Blue/Green-Einsatz, der voll und ganz mit dieser Arbeitsphilosophie verbunden ist. Was ist also Blue/Green DevOps? Was sind die Vorteile? Und was sind die Herausforderungen? Wie kann man dieses Pattern nutzen? Die Antworten findest du hier. Was ist […]
Folgen und Reihen Mathe: Das Prinzip verstehen

In diesem Artikel werden wir zwei Schlüsselbegriffe der Mathematik kennen lernen: Folgen und Reihen. Um sie vollständig zu verstehen, sind einige Grundkenntnisse der Mathematik erforderlich. Folgen und Reihen sind in der Mathematik weit verbreitet und können verwendet werden, um Folgen von mathematischen Objekten wie Polynomen, Zahlen, Mengen, Funktionen usw. zu definieren. Hier werden wir uns […]
Unüberwachtes Lernen: Prinzip und Verwendung

Was die Zukunftsaussichten betrifft, so richten sich viele Hoffnungen auf das unüberwachte Lernen zur Verbesserung der Cybersicherheit oder zur Identifizierung verschiedener Krankheiten. Im Gegensatz zum überwachten Lernen muss der Algorithmus beim unüberwachten Lernen mit nicht annotierten Beispielen arbeiten. In diesem Fall erfolgt das Lernen durch die Maschine völlig unabhängig. Die Maschine wird mit Daten gefüttert, […]
SVM, was ist das wie funktioniert es? Teil 2

Willkommen zum zweiten Teil dieses Dossiers über die Support Vector Machine. Im vorherigen Artikel haben wir die Funktionsweise und die Hauptfehler von Maximal Margin Classifier beschrieben. Unser Ziel ist es nun, unserem Algorithmus zu erlauben, eine gewisse Anzahl von Fehlern bei der Auswahl der Trennungsgeraden zu machen. Dies wird als „soft margin“ bezeichnet, was man […]
Stilübertragung mit CycleGAN

Der Neural Style Transfer (NST) ist eine Sammlung von Modellen und Methoden, die es ermöglichen, den visuellen Stil von Bildern oder Videos auf ein anderes Bild zu übertragen. In diesem Artikel beschäftigen wir uns mit einem bestimmten Modell, das CycleGAN heißt. Heutzutage sind die erfolgreichsten Algorithmen im Bereich NST angepasste Deep-Learning-Algorithmen, die Faltungsschichten verwenden. In […]
Streamlit: Das Tool, um deine Machine-Learning-Projekte zu präsentieren

Streamlit: Ein wichtiger Schritt bei der Verarbeitung von Daten in Machine Learning ist ihre grafische Darstellung, um sie zu visualisieren und ihr Verhalten besser zu verstehen. Daher müssen Personen, die einen Beruf wie Data Scientist ausüben, regelmäßig Daten interpretieren und für andere Teams in ihrer Firma visualisieren. Erstellen von Web-Apps mit Streamlit Im Gegensatz zu […]
AttGAN: Ein Tool zur Veränderung von Gesichtsattributen

Die Bearbeitung von Gesichtsattributen, auch Facial Attribute Editing genannt, bezeichnet alle Methoden, die zum Ziel haben, ein oder mehrere Attribute eines bestimmten Gesichts zu verändern. Vor dem Aufkommen von Deep Learning war dies eine mühsame Aufgabe, da sie Pixel für Pixel von Hand durchgeführt wurde. Seit kurzem gibt es jedoch neue Algorithmen, die es ermöglichen, […]
CatBoost: Das Must-Have im Machine Learning

Seit 2017 ergänzt CatBoost die bestehende Palette an Tools für maschinelles Lernen. CatBoost ist schnell, effizient und präzise und gehört zu den führenden Technologien im Bereich des Gradient Boosting. In diesem Artikel erklären wir dir alles, was du über diese Technologie wissen musst: Anwendungen, Vorteile, Funktionsweise. Was ist CatBoost ? CatBoost ist ein Open-Source-Algorithmus, der […]