Apache Ambari ist ein Programm der Apache Foundation, das die Verwaltung, Bereitstellung und Prüfung von Hadoop-Clustern vereinfachen soll. Ambari bietet ein intuitives und benutzerfreundliches Webinterface, das auf seinen RESTful APIs aufbaut.
Was ist ein Hadoop-Cluster?
Um Ambari zu verstehen, ist es notwendig zu wissen, was ein Hadoop-Cluster ist.
Ein Hadoop-Cluster ist per Definition eine Gruppe von Computern (Knoten genannt), die gemeinsam daran arbeiten, unstrukturierte Massendaten in einer verteilten Umgebung zu speichern und zu verarbeiten. Basierend auf dem Open-Source-Framework Hadoop werden diese Daten parallel mit sehr hoher Leistung verarbeitet.
Wie ist Apache Ambari aufgebaut?
Ambari besteht aus den folgenden Komponenten:
Der Ambari-Server
Dies ist der Einstiegspunkt für alle administrativen Aufgaben auf Ambari. Es ist nicht mehr und nicht weniger als ein Shell-Skript, das Python-Code verwendet (ambari-server.py).
Der Ambari-Agent
Ein Agent läuft auf allen Knoten, die du verwalten möchtest. Er sendet regelmäßig ein Signal (Heartbeat genannt) an den Hauptknoten. Die verschiedenen Aufgaben, die vom Server gesendet werden, werden über den Agenten geleitet.
Das Ambari-Webinterface
Eine der wichtigsten Funktionen und auch ein Highlight von Ambari ist seine Webschnittstelle. Wenn es eingesetzt wird, ist es auf Port 8080 offengelegt und durch ein Authentifizierungssystem geschützt. Sobald du dich eingeloggt hast, kannst du natürlich deine Hadoop-Cluster einsehen und kontrollieren.
💡Auch interessant:
Apache Spark |
Apache Kafka |
Apache Cassandra |
Apache Schulung |
Apache Airflow |
Die Datenbank
Ambari unterstützt mehrere relationale Datenbankmanagementsysteme, damit du die Entwicklung und den Gesundheitszustand deiner Hadoop-Infrastruktur verfolgen kannst. Bei der Erstkonfiguration von Ambari wirst du aufgefordert, die Datenbank auszuwählen, die du verwenden möchtest. Die folgenden Datenbanken werden unterstützt:
- PostgreSQL
- Embedded PostgreSQL
- Oracle
- MySQL
- MariaDb
- SQL Server
- SQL Anywhere
- BerkeleyDB
Funktionen und Vorteile von Ambari
Apache Ambari ist reich an Funktionalitäten.
Apache Ambari kann auf einer Vielzahl von Plattformen (Windows, Mac, Ubuntu, Red Hat, Suse, etc.) ausgeführt werden. Dies wird durch seine Architektur ermöglicht, die unabhängig von Hard- und Softwarespezifikationen ist.
Die Versionen von Apache Ambari sind selbstverwaltet und benötigen daher keine externen Versionierungswerkzeuge wie Git. Daher ist es einfach, eine Ambari-Anwendung oder Ambari selbst zu aktualisieren.
Es ist möglich, die Funktionalität bestehender Apache Ambari Anwendungen zu erweitern, indem einfach verschiedene Ansichtskomponenten hinzugefügt werden.
Bei einem Absturz wird deine Arbeit dort fortgesetzt, wo sie aufgehört hat, ähnlich wie z. B. ein Office-Dokument nach einem Absturz.
Ambari verfügt über eine hohe Sicherheit und kann auch mit einem Verzeichnis wie LDAP oder Active Directory synchronisiert werden.
Verwendung von Apache Ambari
Apache Ambari unterstützt die wichtigsten Hadoop-Komponenten wie Hive, Pig, MapReduce, HBase, HDFS und andere. Es gibt jedoch auch andere Einsatzmöglichkeiten, die wir uns kurz ansehen werden:
- Provisionierung von Hadoop-Clustern: Die Provisionierung ist dank des Assistenten und der vereinfachten Prozesse sehr einfach.
- Überwachung deiner Cluster: Durch das Sammeln von Metriken kann ein detailliertes Dashboard über den Gesundheitszustand deiner Cluster zur Verfügung gestellt werden.
- Verwaltung deiner Cluster: Über das Webinterface bietet dir Ambari eine zentrale Plattform für die Verwaltung deiner Cluster.
Fazit
Wie wir gerade gesehen haben, ist Apache Ambari ein einfaches und mächtiges Werkzeug für die Verwaltung deiner Hadoop-Cluster. Seine benutzerfreundliche Benutzeroberfläche, die einfachen Installationsschritte und das Dashboard bieten eine intuitive Erfahrung für Systemadministratoren und Anwendungsentwickler.
Es vereinfacht die Verwaltung von Hadoop-Clustern und verbessert deine Effizienz bei allen Prozessen, die mit deinen Clustern zusammenhängen.
Jetzt, wo du einiges über Apache Ambari weißt und noch mehr über dieses Werkzeug lernen möchtest, bist du bei DataScientest genau richtig. Entdecke unsere Schulungen!