Standardiser des valeurs dans des cellules avec l'autocomplétion - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-02-21

Lorsque vous modifiez une cellule dans une colonne dont le type sémantique se base sur un dictionnaire ou un type composé, l'application suggère automatiquement des valeurs faisant partie de ce dictionnaire, au cours de votre saisie, pour s'assurer que la colonne suit le même standard.

Dans cet exemple, vous utilisez un jeu de données contenant des données clients, notamment des codes d'États des États-Unis. Comme toutes les occurrences de Texas n'ont pas été correctement saisies au format respectant le code à deux lettres, une partie des données est considérée comme invalide dans la colonne State, comme indiqué dans la barre de statistiques. Vous allez isoler les lignes contenant des erreurs, modifier l'une des cellules grâce à l'autocomplétion et appliquer la modification à toutes les cellules identiques, dans toute la colonne en une opération.

Jeu de données contenant des informations clients comprenant des codes d'État des États-Unis.

Avant de commencer

L'autocomplétion n'est disponible que si le type sémantique de la colonne est basé sur un dictionnaire de valeurs ou un type composé présent par défaut dans Talend Data Preparation, ou que vous avez créé avec Talend Dictionary Service. Pour plus d'informations concernant la création de types sémantiques personnalisés, ou la modifications des types existants, consultez Enrichissement des bibliothèques de types sémantiques.

Procédure

  1. Dans la colonne State, cliquez sur la partie orange de la barre de statistiques et cliquez sur Select rows with invalid values for State pour appliquer un filtre et isoler les lignes comprenant Texas.
  2. Dans la colonne State, double-cliquez sur l'une des occurrences de Texas.
    Vous pouvez désormais modifier le contenu de la cellule. Lorsque vous supprimez la valeur précédente, une liste déroulante s'ouvre, vous suggérant toutes les valeurs faisant partie du type sémantique US State Code basé sur un dictionnaire, classées par ordre alphabétique.
  3. Étant donné que le code du Texas ne fait pas partie des premiers résultats affichés, commencez à saisir T pour voir les résultats retournés.
    Plus vous saisissez de lettres, plus les résultats sont précis. Si la valeur souhaitée peut être trouvée dans la liste d'origine, vous pouvez directement la sélectionner.
  4. Dans cette liste raccourcie, sélectionnez le code correspondant au Texas, TX.
    Code d'État TX sélectionné dans la liste.
  5. Cochez la case Apply to all cells with this value qui s'affiche une fois que vous avez terminé de saisir ou de sélectionner une valeur.
    La modification apportée dans cette cellule va également s'appliquer à toutes les autres valeurs incorrectes.
  6. Cliquez sur Submit.

Résultats

Grâce aux suggestions, vous êtes sûr(e) que la nouvelle valeur est appliquée au bon format. Toutes les autres occurrences incorrectes de Texas ont été remplacées par le code d'État TX en une opération. La barre de statistiques indique à présent que toutes les données dans la colonne State sont valides.