Power Query : Comment fusionner 2 tables ?

-
3
 m de lecture
-

Confrontés à de nombreuses sources de données, les experts data doivent identifier les relations entre les différentes informations. Pour cela, ils peuvent fusionner deux tables avec Power Query. Cet éditeur de requête simplifie le travail de modélisation des données, pour une analyse plus efficace et plus fiable.

En quoi consiste la fonctionnalité fusion dans Power Query ?

La fusion de tables dans Power Query permet de joindre deux requêtes qui se trouvent dans Excel ou une requête Excel et une requête provenant d’une source de données externe(comme Power BI). Vous avez alors le choix entre deux types de fusion : 
  • La fusion incorporée: les données sont intégrées dans une requête existante. 
  • La fusion intermédiaire : une nouvelle requête est créée pour chaque opération de fusion.

Par exemple, ce type de regroupement peut être intéressant pour les entreprises possédant plusieurs filiales. Dans ce cas, chaque filiale possède souvent sa propre table représentant les ventes. Si vous souhaitez une vision consolidée de toutes les transactions du groupe, il est possible d’utiliser Power Query et de fusionner les tables des filiales. 

Bon à savoir : vous ne pourrez fusionner que deux requêtes pour lesquelles vous avez les droits d’accès nécessaires. En effet, les différents niveaux de confidentialité de Power Query (public, organisationnel et privé) vous empêchent de fusionner par erreur des tables contenant des données sensibles.

Comment fusionner 2 tables avec Power Query ?

La fusion de 2 tables avec l’éditeur de requête Power Query

Dès lors que vous avez 2 tables à regrouper avec au moins une ou plusieurs colonnes à combiner, vous pouvez utiliser Power Query et fusionner les 2 tables. Voici la manipulation à effectuer : 
  • Commencez par ouvrir une requête à partir de l’éditeur Power Query.
  • Choisissez une cellule et sélectionnez « Requête », puis « Modifier ». 
  • Dans « Accueil », cliquez sur « Fusionner les requêtes ». Attention, par défaut, il s’agit d’une fusion incorporée. Si vous souhaitez une fusion intermédiaire, cliquez sur « Fusionner les requêtes comme Nouveau ». 
  • Dans la boîte de dialogue, sélectionnez la table principale en premier, puis une colonne de jointure (il suffit de cliquer sur l’entête de la colonne). 
  • Sélectionnez ensuite la table secondaire associée, puis la colonne correspondante. Vous verrez alors apparaître le nombre de correspondances. Cela vous permettra de savoir s’il y a ou non des erreurs dans l’opération de fusion. 
  • Sélectionner le type de jointure. 
  • Cliquez sur « Utiliser la correspondance approximative pour effectuer la fusion », puis choisissez parmi les différentes options de correspondance approximative. Cette étape est optionnelle. 
  • Cliquez sur « Inclure uniquement les lignes correspondantes ». À défaut, vous obtiendrez une jointure externe gauche. 
  • Cliquez sur OK.

Les différents types de jointure

À travers sa requête de fusion de tables, Power Query vous propose plusieurs types de jointures. Voici les possibilités qui s’offrent à vous : 

  • La jointure interne : c’est l’option par défaut. Dans ce cas, seules les lignes correspondantes aux tables primaires et secondaires seront intégrées.
  • La jointure externe gauche : toutes les lignes de la table primaire sont maintenues, avec en plus les lignes correspondantes de la table secondaire.
  • La jointure externe droite : à l’inverse, toutes les lignes de la table secondaire sont maintenues, avec en plus les lignes correspondantes de la table primaire.
  • Le plein externe : les lignes de deux tables sont introduites dans leur intégralité. 
  • L’anti-jointure gauche : seules les lignes de la table primaire n’ayant pas de correspondance avec la table secondaire sont associées.
  • L’anti-jointure droite : seules les lignes de la table secondaire n’ayant pas de correspondance avec la table primaire sont associées. 
  • La jointure croisée : il combine toutes les lignes de la table primaire avec celles de la table secondaire.

Astuces bonus

Astuce nº 1 : Pour réussir à fusionner 2 tables avec Power Query, vous devez avoir le même nombre de colonnes à faire correspondre, et surtout, les sélectionner dans l’ordre. 

Par exemple, si, pour la table principale, vous sélectionnez une colonne prix unitaire en premier, une colonne produit en second et une colonne quantité en troisième, vous devez respecter exactement le même ordre pour la table secondaire. C’est cet ordre de sélection qui permettra la comparaison des colonnes communes. 

De même, les colonnes liées doivent avoir le même format. Ainsi, les 2 colonnes prix doivent contenir des nombres, alors que les deux colonnes produit contiennent des données textuelles. 

Astuce nº 2 : Pour mieux comprendre les relations entre les deux tables fusionnées, il est possible d’utiliser la boîte de dialogue “Dépendances de requête”. Pour cela, suivez les étapes ci-dessous : 

  • Cliquez sur « Afficher les dépendances ». 
  • Cliquez sur « Requête ». 
  • Sélectionnez la commande « Disposition » (cela vous permettra de contrôler l’orientation de la représentation visuelle).

Rejoignez DataScientest pour gérer vos bases de données

Grâce à ses multiples requêtes, l’éditeur Power Query est l’un des outils privilégiés des experts data pour gérer et modéliser leur base de données. Mais la maîtrise de toutes les requêtes disponibles nécessite une formation Power Query à la fois théorique et pratique. C’est justement ce que nous proposons chez DataScientest. Après avoir vu les principaux concepts, vous pourrez les mettre en application à travers des cas concrets. Ce faisant, vous devenez opérationnel dès la fin du cursus de formation. Rejoignez-nous !
Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.
Poursuivre la lecture

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?