DirectQuery ist eine alternative Methode für Datenabfragen in Power BI. Hier erfährst Du alles, was du über DirectQuery wissen musst.
Wenn Du mit Daten in Power BI arbeitest, musst Du den Verbindungsmodus auswählen. Der Import-Modus ist in der Regel der am häufigsten verwendete Modus, in Kombination mit dem Tabellenmodell. Dadurch können sehr schnell Abfragen durchgeführt und Berichte erstellt werden. Eine weniger bekannte Alternative ist jedoch DirectQuery.
Was ist DirectQuery ?
DirectQuery ist eine Methode, um Daten zum Zeitpunkt der Abfrage direkt von ihren Quellen abzurufen. Während der Importmodus einen Snapshot der Daten im Speicher ablegt, speichert DirectQuery (DQ) keine Daten.
Bei jeder Anfrage werden die Daten direkt von der Quelle abgerufen. Die Daten befinden sich also vor, während und nach der Ausführung der Abfrage innerhalb der Originalquelle.
Bei jeder Abfrage erzeugen die Benutzer eine Abfrage oder eine Reihe von Abfragen, die in einer bestimmten Reihenfolge ausgeführt werden müssen. Das Tabellenmodell besteht aus der Formula Engine (FE) und der Storage Engine (SE). Die FE nimmt Abfragen an, erstellt einen Abfrageplan und generiert die Abfrage entsprechend der Wahl zwischen Import- und DirectQuery-Modus, um die entsprechende Datenquelle anzusteuern.
Wenn der DirectyQuery-Modus gewählt wird, übersetzt die Formula Engine den DAX in SQL und sendet die Abfrage direkt an die Datenquelle. Die Daten werden von PowerBI nicht aus den zugrunde liegenden Tabellen importiert. Nur die Metadaten bleiben erhalten.
Bei der Verwendung von den Composite Templates von Power BI ist es möglich, den Import- und DirectQuery-Modus innerhalb des Datenmodells zu kombinieren. Die bevorzugte Option kann für jede Tabelle ausgewählt werden. Beachte, dass es möglich ist, zwischen DirectQuery und dem Importmodus zu wechseln, aber nicht umgekehrt.
Der Dual-Modus schließlich ist eine Kombination aus dem Import- und dem DirectQuery-Modus. Die Daten aus der Tabelle werden in den Speicher geladen, können aber auch direkt von der Quelle bei der Abfrage abgerufen werden.
Wann verwendet man DirectQuery ?
Es gibt mehrere Situationen, in denen es besser ist, DirectQuery statt des Importmodus zu verwenden. Dies ist der Fall, wenn du Daten in Echtzeit benötigst. Der Importmodus erstellt nämlich Snapshots der Daten, die periodisch aktualisiert werden. Der DQ-Modus ist besser für Echtzeitabfragen geeignet.
Außerdem eignet sich DirectQuery für große Datenmodelle. Wenn eine .pbix-Datei mit maximaler Größe nicht ausreicht, ist diese Methode besser geeignet. Die Daten bleiben an der Quelle und die Berechnungen werden direkt dort durchgeführt.
In manchen Fällen ist DirectQuery hingegen nicht die optimale Wahl. Wenn deine Quelldatenbank nicht für einen analytischen Workload optimiert ist und die Abfragen auf mehrere Tabellen abzielen müssen, wird der mit DQ erstellte Bericht fehlerhaft sein.
Die Anzahl der Nutzer, die parallel mit dem Bericht interagieren, hat ebenfalls einen Einfluss. Jeder parallele Benutzer erzeugt gleichzeitige Abfragen an die zugrunde liegende Datenquelle. Auch die Leistung des Quellservers und die Netzwerklatenz müssen berücksichtigt werden.
Wie kann man die Datenquelle optimieren?
Es gibt verschiedene Techniken, um die Leistung der Datenquelle zu verbessern. Man kann Indizes hinzufügen und die Datenintegrität sicherstellen.
In der Quelldatenbank können auch persistente Objekte erstellt werden. Aggregationen, Transformationen und Berechnungen können in einer speziellen Tabelle oder einer indizierten Ansicht materialisiert werden. Auf diese Weise kann Power BI alle Daten von einem einzigen Ort aus abrufen, anstatt bei jeder Abfrage komplexe Operationen durchführen zu müssen.
💡Auch interessant:
Tipps und Tricks für Power BI und DirectQuery
Es gibt mehrere Vorgehensweisen, um Power BI und DirectQuery optimal zu nutzen. Achte zunächst darauf, komplexe Power-Query-Transformationen zu vermeiden. Jede Transformation, die auf das Datenmodell angewendet wird, erzeugt eine Abfrage, die an die Quelldatenbank weitergeleitet wird.
Wenn du berechnete Spalten verwenden musst, erstelle sie in der Quelldatenbank und halte sie persistent. Vermeide auch komplexe DAX-Messungen, da die DAX-Meldungen in SQL übersetzt werden müssen.
Vermeide Beziehungen über GUID-Spalten, da dieser Datentyp von Power BI nicht unterstützt wird. Daher wird es notwendig sein, während der Ausführung der Abfrage eine Datenkonvertierung anzuwenden. Die Leistung wird beeinträchtigt. Die Lösung ist, diesen Datentyp in der Quelldatenbank zu konvertieren, bevor Power BI die Abfragen erstellt.
Beschränke die Parallelisierung so weit wie möglich, indem du eine maximale Anzahl an Verbindungen festlegst, die gleichzeitig geöffnet werden können. Diese Anzahl kann in den Optionen eingestellt werden. Es ist auch besser, die Anzahl der Visualisierungen auf der Berichtsseite zu begrenzen, da jede Visualisierung die Zeit verlängert, die für den Datenabruf benötigt wird.
Wie kann man Power BI erlernen ?
Die DirectQuery-Methode ist eine der vielen Funktionen von Power BI. Um den Umgang mit dieser Plattform zu erlernen, kannst du dich für die DataScientest-Ausbildungen entscheiden.
Das Modul Business Intelligence unseres Data Analyst-Kurses behandelt Power BI, Tableau und Data Modeling. Die anderen Module dieses Kurses behandeln die Programmierung in Python, Datenvisualisierung, Textdatenverwaltung und Big Data. Nach Abschluss des Kurses hast du alle Fähigkeiten, um Data Analyst zu werden.
In diesem Beruf geht es darum, die Daten eines Unternehmens zu analysieren, um ihm zu helfen, bessere Entscheidungen zu treffen. Die Ergebnisse der Analysen werden in Form von Visualisierungen und Berichten weitergegeben, so dass Führungskräfte und Manager sie nutzen können. Power Bi ist eines der vielen Werkzeuge des Data Analysts.
Die DataScientest-Schulungen zeichnen sich durch einen innovativen Blended-Learning-Ansatz aus, der Online-Lernen und Präsenzveranstaltungen (MasterClass) miteinander verbindet. Der Kurs kann in einem intensiven BootCamp innerhalb weniger Wochen abgeschlossen werden, oder als Weiterbildung, um parallel dazu eine persönliche oder berufliche Aktivität zu verfolgen.
85 % der Alumni haben sofort einen Job gefunden.
Entdecke den Data Analyst-Kurs und melde Dich jetzt unter dieser Adresse an:
Du weißt jetzt ein bisschen mehr über DirectQuery für Power BI.
Erfahre auch mehr über Dataflow BI.