Les valeurs manquantes dans Power Query

Traitement des cellules vides avec Power Query

Vous devez quérir des valeurs dans les ténèbres d'une base de données et là, enfer ! Il en manque ! Comment traverser cette épreuve ? Le salut viendra de Power Query.

quête

 

Identification des valeurs manquantes

Vous repérez sur le tableau Excel ci-dessous que certaines valeurs sont manquantes. Or, s'il s'agissait d'une base de données gigantesque, ces absences ne vous sauteraient pas aux yeux. Comment savoir si des données manquent et où ?

données

Lançons l'éditeur Power Query et importons ce fichier de données.

Avant toute manipulation, on remarque que deux jauges ne sont pas pleines. En particulier, celle de la colonne Couleur indique une forte proportion de valeurs manquantes (Cf. extrait du tableau ci-dessous).

jauges

Pour connaître le nombre exact de valeurs manquantes dans une colonne, onglet Affichage puis cochez Profil de colonne. Dans les statistiques qui apparaissent figure le nombre de valeurs manquantes.

Ainsi, si l'on est positionné dans la colonne des couleurs, on obtient ceci :

stats

Il apparaît que trois cellules sont vides.

Attention si vous manipulez un grand jeu de données. Ces statistiques ne concernant que les mille premières valeurs, il faut changer ce paramètre limitatif en bas de l'écran (voir le profilage).

Autre technique, cochez Qualité de la colonne, cette fois pour obtenir le pourcentage de cellules vides.

qualité

 

Suppression

Supposons que l'on doive éliminer les enregistrements dont le champ Couleur n'est pas renseigné (ils ne seront pas pour autant supprimés du fichier de base).

On filtre la colonne (bouton à droite de l'entête) pour décocher null.

menu

 

Imputation simple

Autre choix. Au lieu de supprimer les lignes, nous écrivons mystère chaque fois qu'une couleur n'est pas renseignée.

Clic droit sur l'entête de la colonne puis Remplacer les valeurs… Il suffit de remplacer null par mystère.

remplacement

La colonne est valide à \(100\%.\)

 

Imputation avec recherche

Si l'on souhaite regarder de plus près les enregistrements dont un champ est vide, il suffit de faire l'inverse de ce que nous avons fait précédemment, c'est-à-dire un filtrage qui ne sélectionne que les valeurs nulles.

Elles sont ensuite traitées, puis on réintègre tous les autres enregistrements.

 

valeurs manquantes