Application d'une valeur à toutes les cellules - Cloud

Guide de prise en main de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-03-06

Appliquer une certaine valeur à plusieurs cellules à la fois peut vous faire gagner beaucoup de temps lors de la correction des cellules invalides.

La colonne State est la dernière colonne contenant des données incorrectes. Cette colonne liste les États à partir desquels les client·es ont loué un film, à l'aide d'un code à deux lettres. Vous pouvez constater que parmi tous les codes d'État des États-Unis, le Texas semble avoir le plus d'erreurs.

La valeur Texas est invalide.

Plutôt que de simplement supprimer les lignes correspondantes avec la barre de statistiques comme précédemment, vous allez corriger une des cellules invalides et appliquer la nouvelle valeur à toutes les cellules ayant la même erreur. Pour remplacer les occurrences de Texas par la valeur correcte, procédez comme suit :

Procédure

  1. Dans la colonne State, double-cliquez sur l'une des occurrences de Texas.
    Vous pouvez désormais modifier le contenu de la cellule. Lorsque vous supprimez la valeur précédente, une liste déroulante s'ouvre, vous suggérant toutes les valeurs faisant partie du type sémantique US State Code basé sur un dictionnaire, classées par ordre alphabétique.
  2. Étant donné que le code du Texas ne fait pas partie des premiers résultats affichés, commencez à saisir T pour voir les résultats retournés.

    Plus vous saisissez de lettres, plus les résultats sont précis. Si la valeur souhaitée peut être trouvée dans la liste d'origine, vous pouvez directement la sélectionner.

  3. Dans cette liste raccourcie, sélectionnez le code correspondant au Texas, TX.
  4. Cochez la case Apply to identical values.
    Case Apply to identical values (Appliquer aux valeurs identiques).
  5. Cliquez sur Submit.

Résultats

Toutes les occurrences de Texas ont été remplacées par le code correct TX et la barre de statistiques indique que toutes les données de la colonne State sont valides.

Notez que lorsque la colonne State est sélectionnée, les données sont représentées sous forme de carte interactive des États-Unis dans le panneau Data profiling (Profiling de données).

Carte interactive des États-Unis dans le panneau Data profiling (Profiling de données).