Du hast Fragen? Wir haben Antworten! - Bald findet unser nächster Tag der offenen Tür statt!

Logo site

Query Folding: Wie verarbeitet man eine große Anzahl von Daten?

-
3
 Minuten Lesezeit
-
query folding

Angesichts immer größer werdender Datenmengen stehen Datenexperten eine Reihe von Werkzeugen zur Verfügung, um die Verarbeitung dieser Daten zu vereinfachen. Dazu gehören das Falten von Abfragen in Power BI Desktop oder Power Pivot. Mit dieser Funktionalität kannst du deine Möglichkeiten zur Datenanalyse erheblich verbessern.

Was ist also Power Query? Wie funktioniert es? Und vor allem, wie benutzt man es? DataScientest beantwortet deine Fragen.

Was ist Query folding?

Beim Query Folding wird eine einzelne Anweisung generiert, um Quelldaten abzurufen und umzuwandeln. Dadurch wird die Verarbeitung großer Datenmengen vereinfacht.

Diese Abfrage wird vor allem für den Entwurf von Datenmodellen in Power Pivot oder Power BI Desktop verwendet.

💡Gut zu wissen: Es ist möglich, das Query Folding für eine ganze Abfrage (Full Folding) oder nur für einige Schritte (Partial Folding) zu verwenden.

Wie funktioniert query folding?

Um das Query Folding zu nutzen, musst du eine Reihe von Anweisungen in SQL-Code schreiben und an die Datenbank weiterleiten, damit diese Anweisungen ausgeführt werden. Die Idee ist dann, die Datenmenge an der Quelle zu reduzieren, bevor sie verarbeitet und an Power BI oder Power Pivot weitergeleitet werden.

Aber Achtung: Damit das Query Folding richtig funktioniert, müssen die folgenden Bedingungen erfüllt sein:

Die Datenquelle unterstützt Query Folding

Keine Sorge, die meisten Quellen unterstützen das Falten von Abfragen. Das gilt für relationale Datenbanken, OData-Feeds, SharePoint Lists, Azure Synapse Analytics, Exchange, Active Directory, HDFS und andere.

Wenn deine Daten jedoch aus einer flachen Datei, aus Blob-Objekten oder aus dem Web stammen, kannst du Query Folding nicht verwenden.

Transformation ermöglicht das Falten von Daten

Abgesehen von den Datenquellen müssen die Konfigurationsschritte auch das Falten von Abfragen ermöglichen. Normalerweise handelt es sich dabei um Transformationen, die unter einer einzigen SELECT-Anweisung geschrieben werden können. Hier sind einige Beispiele:

  • das Löschen von Spalten ;
  • das Filtern von Zeilen (mit einer WHERE-Abfrage) ;
    das Gruppieren von Daten (mit einer GROUP BY-Abfrage) ;
  • das nicht näherungsweise Zusammenführen (mit einer JOIN-Abfrage) ;
  • das Hinzufügen oder Löschen einer Pivot-Tabelle.

Wenn von allen Anweisungsschritten nur eine Aktion nicht gefaltet werden kann, stoppt das Query Folding für die gesamte Abfrage. Beispiele für Transformationen, die das Query Folding verhindern, sind:

  • das Zusammenführen oder Hinzufügen von Abfragen, die auf verschiedenen Quellen basieren ;
  • das Hinzufügen von benutzerdefinierten Spalten mit komplexer Logik ;
  • das Hinzufügen von Indexspalten.

Generell wirst du Schwierigkeiten haben, Query Folding zu verwenden, wenn die Transformation mehrere Datenquellen umfasst.

💡Gut zu wissen: Wenn das Query Folding nicht erreicht werden kann, übernimmt die Mashup Power Query Engine die Aufgabe, die Daten selbst umzuwandeln. Dies ist jedoch in der Regel langsamer; umso mehr, wenn du große Datenmengen verarbeiten willst.

Der Antrag kann gefaltet werden

Um herauszufinden, ob eine Abfrage gefaltet werden kann, führe die folgenden Schritte aus:

  • Gehe im Power Query-Editor auf den Reiter „Einstellungen“ der Abfrage.
  • Klicke mit der rechten Maustaste auf den zuletzt angewandten Schritt ;
  • Überprüfe die Option „Native Abfrage anzeigen“. Wenn sie aktiviert ist (nicht ausgegraut), kann die Abfrage gefaltet werden.
  • Wenn nicht, kann die Abfrage nicht gefaltet werden.

💡Gut zu wissen: Diese Option „Native Abfrage anzeigen“ wird nur bei bestimmten Konnektoren angezeigt. Zum Beispiel ist sie für OData-Konnektoren nicht verfügbar. Wenn dies der Fall ist, verwende die Funktion „Abfragediagnosen“.

Außerdem darf die Abfrage nicht mit deinem eigenen SQL-Code beginnen. Andernfalls wird kein Schritt der Abfrage gefaltet.

Wie verwende ich die Query Fold?

Um ein Query Folding in Power BI durchzuführen, musst du folgende Schritte ausführen:

  • Verbinde dich mit einer Datenquelle in Power BI, die Query Folding unterstützt. Klicke dazu auf „Daten beziehen“ und wähle die entsprechende Datenquelle aus.
  • Lade die Daten, bevor du alle gewünschten Änderungen vornimmst.
  • Klicke auf „Daten umwandeln“, wodurch du zum Power Query-Editor weitergeleitet wirst. Hier kannst du z. B. Spalten löschen, Zeilen hinzufügen, die Zeilen einer Spalte aufsteigend sortieren usw.
  • Kehre zum Reiter „Startseite“ zurück und klicke auf „Schließen und anwenden“, um die Daten in Power BI zu laden.

Der Vorgang kann dann für alle Spalten wiederholt werden, auf die du ein Query Folding anwenden möchtest.

Auch wenn Query Folding für die Datenmodellierung unerlässlich ist, ist es nur eine von vielen Abfragen. Um mit riesigen Datenmengen effektiv umgehen zu können, bist du bie Datascientest richtig. Entdecke unsere Schulungen.

Was du dir merken solltest:

  • Indem es eine einzige Anweisung zur Umwandlung von Datensätzen generiert, vereinfacht das Query Folding die Verarbeitung großer Datenmengen.
  • Es kann jedoch nicht für alle Abfragen verwendet werden. Denn die Quellen und die angeforderten Transformationen müssen Query Folding unterstützen. Und vor allem muss die Abfrage faltbar sein.
  • Wenn alle diese Bedingungen erfüllt sind, kannst du große Datenmengen aus dem Power Query-Editor heraus transformieren.

DataScientest News

Melde Dich jetzt für unseren Newsletter an, um unsere Guides, Tutorials und die neuesten Entwicklungen im Bereich Data Science direkt per E-Mail zu erhalten.

Möchtest Du informiert bleiben?

Schreib uns Deine E-Mail-Adresse, damit wir Dir die neuesten Artikel zum Zeitpunkt der Veröffentlichung zusenden können!
icon newsletter

DataNews

Starte Deine Karriere im Bereich Data: Erhalte regelmäßig Insiderwissen und wertvolle Karrieretipps in Deinem Posteingang.