Application d'une valeur à toutes les cellules - Cloud

Guide de prise en main de Talend Cloud Data Preparation

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Preparation
Content
Qualité et préparation de données > Nettoyage de données

La possibilité d'appliquer une certaine valeur à plusieurs cellules à la fois peut vous faire gagner beaucoup de temps au moment de corriger des cellules invalides.

La colonne State est la dernière colonne contenant des données invalides. Cette colonne liste les États depuis lesquels les clients se sont inscrits, en utilisant un code à deux lettres. Vous pouvez remarquer que parmi les différents codes d'États des États-Unis, les occurrences de Texas ressortent comme des erreurs.

Plutôt que de supprimer ces lignes à l'aide de la barre de statistiques comme vous l'avez fait précédemment, vous allez corriger l'une des cellules invalides et appliquer la nouvelle valeur à toutes les cellules qui comportent la même erreur. Pour remplacer les occurrences de Texas par la valeur correcte, procédez comme suit :

Procédure

  1. Dans la colonne State, double-cliquez sur l'une des occurrences de Texas.
    Vous pouvez désormais modifier le contenu de la cellule. Lorsque vous supprimez la valeur précédente, une liste déroulante s'ouvre, vous suggérant toutes les valeurs faisant partie du type sémantique US State Code basé sur un dictionnaire, classées par ordre alphabétique.
  2. Étant donné que le code du Texas ne fait pas partie des premiers résultats affichés, commencez à saisir T pour voir les résultats retournés.

    Plus vous saisissez de lettres, plus les résultats sont précis. Si la valeur souhaitée peut être trouvée dans la liste d'origine, vous pouvez directement la sélectionner.

  3. Dans cette liste raccourcie, sélectionnez le code correspondant au Texas, TX.
  4. Cochez la case Apply to identical values.
  5. Cliquez sur Submit.

Résultats

Toutes les occurrences de Texas ont été remplacées par le code correct TX et la barre de statistiques indique que toutes les données de la colonne State sont valides.

Notez que lorsque la colonne State est sélectionnée, les données sont représentées sous forme de carte interactive des États-Unis dans le panneau Data profiling.