🚀 Bist Du bereit für eine Karriere im Bereich Data? Finde es in nur 60 Sekunden heraus!

Buckets auf der Google Cloud Platform (GCP Buckets): Was ist das? Wozu dient es?

-
4
 Minuten Lesezeit
-
bucket

Egal, ob du eine Anwendung, Software, eine Website oder ein anderes Webprojekt entwirfst, du musst viele Daten speichern. Und um deine Leistung zu optimieren, ist es von entscheidender Bedeutung, diese gut zu organisieren. Dafür stehen dir verschiedene Tools zur Verfügung, darunter auch GCP Buckets. Also, was ist es? Wie kann man es nutzen? Wir beantworten all deine Fragen.

Was sind GCP Buckets?

Ein Bucket ist ein Container, in dem Objekte innerhalb von Google Cloud Storage gespeichert werden.

GCP Buckets in der Google Cloud

Um GCP Buckets besser zu verstehen, muss man verstehen, wie sie innerhalb einer Organisation zusammenhängen :

  • Google Cloud Storage: Die Organisation wählt GCS, um alle ihre Daten zu speichern.
  • Projekt: Wenn die Organisation Anwendungen, eine Website, … erstellt, kann sie diese in Projekte einteilen, um die Verarbeitung der Daten zu erleichtern.
  • Bucket: Innerhalb eines Projekts können mehrere Buckets implementiert werden. Zum Beispiel ein Bucket für Fotodateien, ein anderes für Videodateien, ein weiteres für Tabellendateien, …
  • Objekt: Innerhalb dieser Buckets werden mehrere Objekte (oder einzelne Daten) zusammengefasst. Zum Beispiel steht in der Datei „Foto“ ein Objekt für ein bestimmtes Foto.

Jedes dieser Elemente ist eine Ressource innerhalb der Google Cloud, genauso wie die Instanzen der Compute Engine Virtual Machine.

Objekte in Google Cloud Storage

Bevor wir weitergehen, sollten wir uns noch einmal die Definition eines Objekts ansehen. Ein Objekt ist eine Datei in einem beliebigen Format (.png, .jpeg…), die aus folgenden Elementen besteht:

  • aus einem einzelnen Datensatz: Dieser ist unveränderlich. Das bedeutet, dass sie während der gesamten Speicherdauer nicht verändert werden können.
  • Metadaten: Sie beschreiben die Hauptmerkmale der Daten.

Wie verwende ich Buckets auf der Google Cloud Platform?

Die Wahl des richtigen Werkzeugs

Um mit den GCP Buckets zu interagieren, kannst du verschiedene Tools verwenden:

  • Console: Hierbei handelt es sich um die Google Cloud Console. Diese ermöglicht es dir, einen Bucket zu erstellen, Objekte zu importieren oder hochzuladen, … über eine visuelle Schnittstelle.
    Google Cloud CLI: In diesem Fall nutzt du Befehlszeilen über ein Terminal, um mit deinen Buckets zu interagieren.
  • Bibliothek: Du kannst auch verschiedene Programmiersprachen (C++, C#, Go, Java, Node.js, PHP, Python und Ruby) verwenden, um deine Daten zu verwalten.
  • REST-APIs: Dies sind die JSON- oder XML-APIs, die du verwenden solltest, um verschiedene Operationen innerhalb des Google Cloud Storage durchzuführen.
  • Terraform: Dies ist ein deklaratives Tool, mit dem du deine gesamte Cloud-Infrastruktur verwalten kannst.

Das Erstellen von Buckets

Standardmäßig werden Buckets am multiregionalen US-Standort mit der Standardspeicherklasse erstellt. Es ist aber immer möglich, diese Elemente bei der Erstellung zu ändern. Nach der Erstellung hingegen kannst du dies nicht mehr tun, da die Speicherklasse und der Standort nicht veränderbare Metadaten sind.

Um einen Bucket auf GCP zu erstellen, kannst du die oben genannten Werkzeuge (Konsole, Kommandozeile, Bibliothek, REST API, Terraform) verwenden. Da jedes dieser Tools es dir ermöglicht, auf unterschiedliche Weise mit Google Cloud Storage zu interagieren, ist es ratsam, eine umfassende Schulung zu absolvieren, um alle Tools zu beherrschen.

 

💡Auch interessant:

Google Maps Low Code Tool
Datenschutz: Welche Analytics Alternativen gibt es
AWS oder Google Cloud ?
Google KI MusicLM
Google Compute Engine
Google Data Studio – Alles über das Dataviz Tool

Der Import von Objekten

Der Import von Objekten ermöglicht es dir, die Elemente deines GCP-Buckets zusammenzustellen. Dieser Vorgang kann auf verschiedene Arten durchgeführt werden:

  • Import per Einzelabfrage: Dies eignet sich vor allem für kleine Objekte.
  • Import aus dem Speicher: Anstatt aus einem Dateisystem importierst du aus dem Speicher.
  • Import mit Übernahme: Im Gegensatz zur einmaligen Abfrage ist diese Art des Imports zu bevorzugen, wenn du große Objekte hast. Aus gutem Grund ist dies eine der zuverlässigsten Übertragungsmethoden.
  • Mehrteiliger Import: Hierfür musst du die XML-API verwenden. Hier werden die Objekte in mehreren Teilen importiert. Aber sobald sie im Bucket sind, werden sie innerhalb einer einzigen Abfrage zusammengesetzt.
  • Paralleler zusammengesetzter Import: Hierbei wird die Datei fragmentiert.
  • Streaming-Import: Du kannst die Daten importieren, ohne sie vorher in einer Datei zu speichern.

Über den Import hinaus kannst du die Objekte auch auf unterschiedliche Weise hochladen (standardmäßig, als Stream oder in mehreren Teilen).

Die Änderung von Objekten

Wie bereits erwähnt, bestehen die in einem GCP-Bucket gespeicherten Objekte aus unveränderlichen Daten.

Mit anderen Worten: Daten, die zwischen dem Importieren und dem Löschen nicht verändert werden können. Du kannst also keine Änderungen an dem Objekt vornehmen, wie z. B. Hinzufügen oder Abschneiden. Es ist jedoch immer möglich, bestehende Objekte zu ersetzen, wenn die Daten eine Überarbeitung erfordern. Dazu muss eine neue Version des Objekts in den Bucket importiert und die alte Version gelöscht werden.

In diesem Zusammenhang ändert sich die Generierungsnummer des Objekts. Dadurch wird das Objekt als einzigartig identifiziert.

Gut zu wissen: Du kannst ein und dasselbe Objekt nicht mehr als einmal pro Sekunde ersetzen. Dies führt zu „429 too many requests“-Fehlern.

Das Löschen eines Buckets

Wenn du dich entscheidest, einen Bucket zu löschen, löschst du auch alle mit ihm verbundenen Objekte. Daher sollte dieser Vorgang mit äußerster Sorgfalt durchgeführt werden.

Wir empfehlen dir, die Einstellungen für den Lebenszyklus der Daten im Voraus festzulegen. Dies hilft dir, mögliche Fehler bei der Bearbeitung zu vermeiden. Mit diesen Optionen kannst du festlegen, wie lange ein Bucket aufbewahrt werden soll, wie einzelne Daten aufbewahrt werden sollen oder wie die Versionen von Objekten verwaltet werden sollen.

Neben diesen verschiedenen Aktionen ist es auch möglich, alle GCP Buckets eines Projekts aufzulisten, Informationen über Metadaten zu erhalten, einen Bucket zu verschieben oder umzubenennen… Du möchtest wissen, wie das geht? Nimm an unseren Schulungen bei Datascientest teil.

Was du dir merken solltest

  • GPC Buckets sind Container, in denen du Objekte auf der Google Cloud Platform speichern kannst.
    Mit diesen Speicherwerkzeugen kannst du Daten organisieren, die sich auf ein Projekt beziehen. So enthält jedes Projekt mehrere Buckets, und jeder Bucket enthält mehrere Daten.
  • Um GPC Buckets zu verwalten, kannst du verschiedene Tools verwenden, z. B. die Google Cloud-Konsole, Befehlszeilen, APIs, Programmiersprachen oder Terraform.

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!
icon newsletter

DataNews

Starte Deine Karriere im Bereich Data: Erhalte regelmäßig Insiderwissen und wertvolle Karrieretipps in Deinem Posteingang.