Configurer la préparation - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-04-16

Pourquoi et quand exécuter cette tâche

Cet exemple vous fait utiliser les fonctions depuis Talend Cloud Data Preparation.

Procédure

  1. Pour corriger les noms de pays, utilisez la fonction de rapprochement flou.
    1. Sélectionnez la colonne : delivery_country.
    2. Dans le panneau de droite, sélectionnez Column et commencez à saisir fuzzy matching.
    3. Sélectionnez la fonction Standardize value (fuzzy matching) (Standardiser la valeur (rapprochement flou)).
    4. Configurez le seuil de rapprochement Match threshold à Default (Par défaut) (> 80%).
    5. Cliquez sur Submit. L'étape est ajoutée aux étapes de préparation dans le panneau de gauche et les noms de pays sont corrigés. Par exemple, United Staates est remplacé par United States.
  2. Pour convertir les codes pays, utilisez une fonction de conversion. La colonne delivery_country est toujours sélectionnée.
    1. Dans le panneau de droite, sélectionnez Column et commencez à saisir convert.
    2. Sélectionnez la fonction Convert country names and codes (Convertir des noms de pays et des codes pays).
    3. Configurez From (De) à ISO country code (Code pays ISO) et To (À) à English country name (Nom de pays anglais).
    4. Cliquez sur Submit. Les noms de pays sont convertis. Par exemple, CA est remplacé par Canada.
  3. Pour corriger le NIF, utilisez la fonctionnalité de lookup.
    Elle vous permet de rapprocher les données de la préparation courante à celles d'un jeu de données de référence. Pour plus d'informations, consultez le Utilisation dynamique des données d'un autre jeu de données.
    Vous devez associer les colonnes qui correspondent.
    1. Sélectionnez la colonne : customer_id. Dans cet exemple, cette colonne est celle qui correspond.
    2. Cliquez sur l'icône de lookup au-dessus du panneau de droite.
      Icône Lookup sélectionnée.
      Le panneau Lookup s'ouvre à droite.
    3. Cliquez sur Select dataset (Sélectionner un jeu de données).
    4. Sélectionnez le jeu de données de référence et cliquez sur Select (Sélectionner). Vous êtes de retour dans le panneau Lookup et le jeu de données de référence est affiché sous la préparation.
      Panneau Lookup avec le jeu de données de référence affiché sous la préparation.
    5. Dans Current preparation (Préparation courante) et Lookup dataset (Jeu de données de lookup), sélectionnez customer_id.
    6. Sélectionnez la colonne du jeu de données de référence à ajouter à la préparation.
      Dans cet exemple, vous souhaitez corriger le NIF. Vous devez sélectionner customer_tax_id.
      customer_tax_id sélectionnée dans l'option Import columns (Importer des colonnes).
    7. Cliquez sur Submit. L'étape est ajoutée aux étapes de préparation dans le panneau de gauche.