Power Query : Comment fonctionne la gestion des erreurs ?

-
3
 m de lecture
-

#NULL!, #REF!, #DIV/0!, N/A …. Les tableaux de données contiennent régulièrement des erreurs limitant l’analyse des données. Heureusement, il est possible de les corriger à travers une bonne gestion des erreurs dans Power Query. DataScientest vous explique justement comment faire.

La gestion des erreurs dans Power Query

L’éditeur de requêtes Power Query connaît deux grands types d’erreurs : celles au niveau de l’étape ou de la colonne.

Au niveau de l’étape

Si une erreur se situe au niveau de l’étape, la requête ne peut pas se charger. Vous verrez alors un message d’erreur apparaître dans une fenêtre jaune. Celle-ci vous renseigne sur les différents composants de l’erreur, à savoir la raison, le message et le détail. Et si vous souhaitez plus d’informations, il est aussi possible de cliquer sur le bouton “Accéder à l’erreur”. Ce sont toutes ces données qui vous permettent d’adopter une gestion efficace des erreurs dans Power Query. 

Voici maintenant les erreurs les plus courantes : 

  • Source introuvable : cette erreur apparaît si vous ne pouvez accéder à la source de données, si vous ne disposez pas des informations d’identification ou si la source a été déplacée. Dans un tel cas, il convient de modifier le chemin d’accès. 
  • Colonne introuvable : c’est ce qui se passe si vous avez mentionné une colonne qui n’existe pas dans la requête. Ici, plusieurs solutions sont possibles, notamment la suppression de l’étape faisant référence à ladite colonne. 
  • Formula.Firewall : cette erreur survient lorsque vous combinez ou fusionnez des données entre plusieurs sources. Avant d’appliquer une solution, il convient de comprendre l’origine exacte du problème en accédant au pare-feu de confidentialité des données.

Au niveau des colonnes

Dans cette hypothèse, la requête se charge, mais la valeur apparaît sous forme d’erreur dans la cellule correspondante. Pour comprendre l’origine de l’erreur, vous pouvez cliquer sur l’espace blanc de la cellule concernée (une nouvelle fenêtre jaune apparaîtra) ou utiliser les outils de profilage des données. Ces erreurs peuvent être liées à un problème de conversion du type de données, des opérations non prises en charge, des valeurs structurées imbriquées, etc.  

Quel que soit le problème, vous disposez de plusieurs solutions de gestion des erreurs avec Power Query. À savoir : 

  • La suppression des erreurs : sélectionnez la colonne concernée puis rendez-vous dans le groupe « Réduire les lignes » sous l’onglet “Accueil”. Cliquez sur « Supprimer les lignes », puis sur « Supprimer les erreurs ».
  • Le remplacement des erreurs : sélectionnez la colonne concernée puis rendez-vous dans le groupe « N’importe quelle colonne » sous l’onglet « Transformer ». Cliquez sur “Remplacer les valeurs”, puis sur « Remplacer les erreurs ». Renseignez ensuite la nouvelle valeur (comme un nombre entier, un texte personnalisé…). 
  • La conservation des erreurs : cela vous permet d’identifier plus facilement les lignes contenant des erreurs. La manipulation est la suivante :  Accueil > Réduire les lignes > Conserver les lignes > Conserver les erreurs.

La gestion personnalisée des erreurs sur l’éditeur de requête

Au-delà des solutions susmentionnées, il est aussi possible de gérer les erreurs avec l’éditeur Power Query en adoptant sa propre logique. 

Voici comment faire : 

  • Remplacer une erreur par une autre valeur : pour cela, il suffit d’ajouter une colonne personnalisée en prévoyant différentes options. Ainsi, dans la fenêtre « Colonne personnalisée », vous pouvez entrez la requête :
    try [colonne-1] otherwise [Colonne-2]
    Si aucune erreur n’est trouvée dans la colonne-1, ce sont ses données qui apparaîtront. À défaut, ce sont les données de la colonne-2.
  • Personnaliser les nouveaux résultats : là encore, vous devez utiliser la colonne personnalisée, mais la requête diffère :
    try [colonne-1] catch (r)=> if r[Message] <> "Invalid cell value '#REF!'." then [colonne-2] else null. 
    Dans ce cas, la colonne-1 ne sera remplacée par la colonne-2 que si le message d’erreur est différent de #REF! ( #NULL! ou #DIV/0!). À défaut, la colonne-1 sera remplacée par “null”.
Pour gérer efficacement toutes ces erreurs avec Power Query, mieux vaut se former. C’est justement possible avec DataScientest. À travers nos programmes, vous apprendrez à maîtriser l’éditeur de requête et de nombreuses tables de données. Rejoignez nos formations.

Ce qu’il faut retenir :

  • Au vu des volumes de données regroupées au sein d’une table, les erreurs sont très courantes. Ce qui peut limiter le traitement et l’analyse des données. 
  • Heureusement, une gestion des erreurs efficaces est possible avec Power Query. 
  • L’éditeur de requête prévoit plusieurs manipulations pour corriger les bugs en fonction du type d’erreur. 
  • Vous pouvez aussi personnaliser les options de correction en fonction de vos besoins.
Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?