Power BI Direct Query : tout savoir sur la méthode de requête de données

-
4
 m de lecture
-
capture d'écran de DirectQuery dans Power BI

DirectQuery est une méthode alternative de requêtes de données sur Power BI. Découvrez tout ce que vous devez savoir sur DirectQuery.

Au moment de travailler avec les données sur Power BI, il est nécessaire de choisir le mode de connectivité. Le mode Import est généralement le plus utilisé, en combinaison avec le modèle Tabulaire. Ceci permet d’effectuer des requêtes et de générer des rapports très rapidement. Toutefois, une alternative moins connue est DirectQuery.

Qu'est-ce que DirectQuery ?

DirectQuery est une méthode permettant de récupérer les données directement depuis leurs sources, au moment de la requête. Alors que le mode Import stocke un snapshot des données en mémoire, DirectQuery (DQ) ne stocke aucune donnée.

À chaque requête, les données sont directement extraites de la source. Les données résident donc au sein de la source originale avant, pendant et après l’exécution de la requête.

À chaque requête, les utilisateurs génèrent une requête ou un ensemble de requêtes nécessitant d’être exécutées dans un ordre spécifique. Le modèle Tabulaire est constitué du Formula Engine (FE) et du Storage Engine (SE). Le FE accepte les requêtes, crée un plan de requête, et génère la requête en fonction du choix entre les modes Import et DirectQuery pour cibler la source de données correspondante.

Si le mode DirectyQuery est choisi, le Formula Engine traduit le DAX en SQL et envoie la requête directement à la source de données. Les données ne sont pas importées par PowerBI à partir des tableaux sous-jacents. Seules les métadonnées sont conservées.

En utilisant les modèles Composite de Power BI, il est possible de combiner les modes Import et DirectQuery au sein du modèle de données. L’option privilégiée peut être choisie pour chaque tableau. Notons qu’il est possible de passer de DirectQuery au mode Import, mais pas l’inverse.

Enfin, le mode Dual est une combinaison entre le mode Import et DirectQuery. Les données en provenance du tableau sont chargées dans la mémoire, mais peuvent aussi être récupérées directement depuis la source au moment de la requête.

Quand utiliser DirectQuery ?

Il est préférable d’utiliser DirectQuery plutôt que le mode Import dans plusieurs situations. C’est le cas si vous avez besoin de données en temps réel. En effet, le mode Import garde des snapshots de données mis à jour périodiquement. Le mode DQ est plus adapté pour les requêtes en temps réel.

En outre, DirectQuery convient pour les larges modèles de données. Si un fichier .pbix de taille maximum n’est pas suffisant, cette méthode est plus adaptée. Les données restent à la source et les calculs y sont effectués directement.

En revanche, dans certains cas, DirectQuery n’est pas le choix optimal. Si votre base de données source n’est pas optimisée pour un workload analytique, et que les requêtes ont besoin de cibler des tableaux multiples, le rapport généré avec DQ sera erroné.

Le nombre d’utilisateurs interagissant en parallèle avec le rapport à aussi un impact. Chaque utilisateur parallèle génère des requêtes simultanées vers la source de données sous-jacente. Il faut aussi prendre en compte les performances du serveur source et la latence du réseau.

Comment optimiser la source de données ?

Il existe différentes techniques permettant d’améliorer les performances de la source de données. On peut ajouter des indexes, et veiller à l’intégrité des données.

 

Des objets persistants peuvent aussi être créés dans la base de données source. Les agrégations, transformations et calculs peuvent être matérialisés dans un tableau spécial ou une vue indexée. Ainsi, Power BI peut retrouver toutes les données depuis un emplacement unique plutôt que d’effectuer des opérations complexes chaque fois qu’une requête est effectuée.

Conseils et astuces pour Power BI et DirectQuery

Plusieurs pratiques permettent d’utiliser Power BI et DirectQuery d’une manière optimale. Veillez d’abord à éviter les transformations Power Query complexes. Chaque transformation appliquée au modèle de données génère une requête transmise à la base de données sources.

Si vous avez besoin d’utiliser des colonnes calculées, créez-les sur la base de données source et conservez-les persistantes. Évitez aussi les mesures DAX complexes, car il est nécessaire de traduire les déclarations DAX en SQL.

Évitez les relations sur les colonnes GUID, car ce type de données n’est pas pris en charge par Power BI. Il sera donc nécessaire d’appliquer une conversion de données pendant l’exécution de la requête. Les performances seront impactées. La solution est de convertir ce type de données au sein de la base source avant que Power BI génère ses requêtes.

Limitez le parallélisme autant que possible, en définissant un nombre maximum de connexions pouvant être ouvertes en simultané. Ce nombre peut être configuré dans les Options. Il est aussi préférable de limiter le nombre de visuels sur la page de rapport, car chaque visuel rallonge le temps nécessaire pour la récupération de données.

Comment apprendre à utiliser Power BI ?

La méthode DirectQuery est l’une des nombreuses fonctionnalités de Power BI. Pour apprendre à utiliser cette plateforme, vous pouvez choisir les formations DataScientest.

Le module Business Intelligence de notre formation Data Analyst aborde Power BI, Tableau et le Data Modeling. Les autres modules de ce cursus couvrent la programmation en Python, la visualisation de données, la gestion de données texte et le Big Data. À l’issue de la formation, vous aurez toutes les compétences pour devenir Data Analyst.

Ce métier consiste à analyser les données d’une entreprise pour l’aider à prendre de meilleures décisions. Les résultats des analyses sont partagés sous forme de visualisations et de rapports, ce qui permet aux cadres et managers de les exploiter. Power Bi est l’un des nombreux outils du Data Analyst.

Les formations DataScientest se distinguent par une approche innovante de Blended Learning, alliant apprentissage en ligne et MasterClass en présentiel. Le parcours peut être complété en BootCamp intensif en quelques semaines, ou en Formation Continue afin de poursuivre une activité personnelle ou professionnelle en parallèle.

Il est possible de financer ce cursus par le biais du Compte Personnel de Formation, et 85% des alumnis ont trouvé du travail immédiatement. Découvrez la formation Data Analyst, et inscrivez-vous dès à présent à cette adresse.

Vous savez tout sur DirectQuery pour Power BI. Découvrez notre dossier complet sur Power BI, et notre introduction à la DataViz.

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?