Du hast Fragen? Wir haben Antworten! - Bald findet unser nächster Tag der offenen Tür statt!

Logo site

Apache Ambari: Ein Tool, das die Verwaltung von Hadoop-Clustern vereinfacht

-
2
 Minuten Lesezeit
-
apache ambari

Apache Ambari ist ein Programm der Apache Foundation, das die Verwaltung, Bereitstellung und Prüfung von Hadoop-Clustern vereinfachen soll. Ambari bietet ein intuitives und benutzerfreundliches Webinterface, das auf seinen RESTful APIs aufbaut.

Was ist ein Hadoop-Cluster?

Um Ambari zu verstehen, ist es notwendig zu wissen, was ein Hadoop-Cluster ist.

Ein Hadoop-Cluster ist per Definition eine Gruppe von Computern (Knoten genannt), die gemeinsam daran arbeiten, unstrukturierte Massendaten in einer verteilten Umgebung zu speichern und zu verarbeiten. Basierend auf dem Open-Source-Framework Hadoop werden diese Daten parallel mit sehr hoher Leistung verarbeitet.

Wie ist Apache Ambari aufgebaut?

Ambari besteht aus den folgenden Komponenten:

Der Ambari-Server

Dies ist der Einstiegspunkt für alle administrativen Aufgaben auf Ambari. Es ist nicht mehr und nicht weniger als ein Shell-Skript, das Python-Code verwendet (ambari-server.py).

Der Ambari-Agent

Ein Agent läuft auf allen Knoten, die du verwalten möchtest. Er sendet regelmäßig ein Signal (Heartbeat genannt) an den Hauptknoten. Die verschiedenen Aufgaben, die vom Server gesendet werden, werden über den Agenten geleitet.

Das Ambari-Webinterface

Eine der wichtigsten Funktionen und auch ein Highlight von Ambari ist seine Webschnittstelle. Wenn es eingesetzt wird, ist es auf Port 8080 offengelegt und durch ein Authentifizierungssystem geschützt. Sobald du dich eingeloggt hast, kannst du natürlich deine Hadoop-Cluster einsehen und kontrollieren.

 

💡Auch interessant:

Apache Spark
Apache Kafka
Apache Cassandra
Apache Schulung
Apache Airflow

Die Datenbank

Ambari unterstützt mehrere relationale Datenbankmanagementsysteme, damit du die Entwicklung und den Gesundheitszustand deiner Hadoop-Infrastruktur verfolgen kannst. Bei der Erstkonfiguration von Ambari wirst du aufgefordert, die Datenbank auszuwählen, die du verwenden möchtest. Die folgenden Datenbanken werden unterstützt:

  • PostgreSQL
  • Embedded PostgreSQL
  • Oracle
  • MySQL
  • MariaDb
  • SQL Server
  • SQL Anywhere
  • BerkeleyDB

Funktionen und Vorteile von Ambari

Apache Ambari ist reich an Funktionalitäten.

image3-3.png

Apache Ambari kann auf einer Vielzahl von Plattformen (Windows, Mac, Ubuntu, Red Hat, Suse, etc.) ausgeführt werden. Dies wird durch seine Architektur ermöglicht, die unabhängig von Hard- und Softwarespezifikationen ist.

image5-4.png
Alle Anwendungen von Ambari können individuell angepasst werden, wobei spezifische Werkzeuge und Technologien in steckbare Komponenten eingekapselt werden müssen.
image7-4.png

Die Versionen von Apache Ambari sind selbstverwaltet und benötigen daher keine externen Versionierungswerkzeuge wie Git. Daher ist es einfach, eine Ambari-Anwendung oder Ambari selbst zu aktualisieren.

image4-4.png

Es ist möglich, die Funktionalität bestehender Apache Ambari Anwendungen zu erweitern, indem einfach verschiedene Ansichtskomponenten hinzugefügt werden.

image8.png

Bei einem Absturz wird deine Arbeit dort fortgesetzt, wo sie aufgehört hat, ähnlich wie z. B. ein Office-Dokument nach einem Absturz.

image6-4.png

Ambari verfügt über eine hohe Sicherheit und kann auch mit einem Verzeichnis wie LDAP oder Active Directory synchronisiert werden.

Verwendung von Apache Ambari

Apache Ambari unterstützt die wichtigsten Hadoop-Komponenten wie Hive, Pig, MapReduce, HBase, HDFS und andere. Es gibt jedoch auch andere Einsatzmöglichkeiten, die wir uns kurz ansehen werden:

  • Provisionierung von Hadoop-Clustern: Die Provisionierung ist dank des Assistenten und der vereinfachten Prozesse sehr einfach.
  • Überwachung deiner Cluster: Durch das Sammeln von Metriken kann ein detailliertes Dashboard über den Gesundheitszustand deiner Cluster zur Verfügung gestellt werden.
  • Verwaltung deiner Cluster: Über das Webinterface bietet dir Ambari eine zentrale Plattform für die Verwaltung deiner Cluster.

Fazit

Wie wir gerade gesehen haben, ist Apache Ambari ein einfaches und mächtiges Werkzeug für die Verwaltung deiner Hadoop-Cluster. Seine benutzerfreundliche Benutzeroberfläche, die einfachen Installationsschritte und das Dashboard bieten eine intuitive Erfahrung für Systemadministratoren und Anwendungsentwickler.

Es vereinfacht die Verwaltung von Hadoop-Clustern und verbessert deine Effizienz bei allen Prozessen, die mit deinen Clustern zusammenhängen.

Jetzt, wo du einiges über Apache Ambari weißt und noch mehr über dieses Werkzeug lernen möchtest, bist du bei DataScientest genau richtig. Entdecke unsere Schulungen!

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!
icon newsletter

DataNews

Starte Deine Karriere im Bereich Data: Erhalte regelmäßig Insiderwissen und wertvolle Karrieretipps in Deinem Posteingang.