Utilisation dynamique des données d'un autre jeu de données - Cloud

Exemples simples de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

La fonctionnalité de lookup rapproche des données du jeu de données courant de leur équivalent dans le jeu de données de référence.

Vous travaillez sur le jeu de données marketing_leads, qui contient des informations relatives à l'entreprise dans laquelle travaillent les clients listés. L'autre jeu de données, emails_reference contient une liste d'entreprises et le domaine d'e-mail qu'elles utilisent.

Vous allez effectuer une opération de lookup sur le jeu de données emails_reference et extraire les informations concernant les domaines d'e-mails, afin de les rapprocher des entreprises du jeu de données marketing_leads.

Avant de commencer

Pour effectuer une opération de lookup sur emails_reference, vous devez l'importer à l'aide du bouton Add dataset (Ajouter un jeu de données), dans la vue Datasets (Jeux de données) de la page d'accueil.

Procédure

  1. Sélectionnez la colonne sur laquelle effectuer le lookup, la colonne company dans cet exemple.
    Cette colonne se trouve dans le jeu de données source, ainsi que dans le jeu de données de référence. Il doit toujours y avoir une colonne commune aux deux jeux de données pour effectuer un lookup.
  2. Cliquez sur le bouton de lookup pour ouvrir le panneau de lookup.
  3. Cliquez sur le bouton et, dans la boîte de dialogue qui s'ouvre, sélectionnez le jeu de données à utiliser pour effectuer l'opération de lookup, le jeu de données emails_reference dans cet exemple.
  4. Cliquez sur Add (Ajouter).
  5. Dans la fenêtre de lookup qui s'ouvre dans la partie inférieure de votre écran, cliquez sur la colonne company_name.
  6. Cochez la case Add to Dataset (Ajouter).
  7. Placez votre pointeur sur le bouton Confirm (Confirmer) pour avoir un aperçu des modifications.
  8. Cliquez sur le bouton Confirm (Confirmer) pour appliquer ces modifications.

Résultats

La colonne email_domain est ajoutée au jeu de données marketing_leads, à côté de la colonne company.

Ces informations concernant les domaines d'adresses e-mail seront ajoutées aux prénoms et noms de famille des colonnes dupliquées, afin de créer des adresses e-mail complètes.