Utiliser les domaines d'e-mail d'un autre jeu de données - 7.3

Exemples d'utilisation de Talend Data Preparation

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
Qualité et préparation de données > Nettoyage de données
Last publication date
2023-08-08

La fonctionnalité de lookup rapproche des données du jeu de données courant de leur équivalent dans le jeu de données de référence.

D'un côté, vous avez le jeu de données marketing_leads, sur lequel vous travaillez qui contient des informations relatives à l'entreprise où travaillent les client·es listé·es. De l'autre côté, emails_reference contient une liste d'entreprises et le domaine d'e-mail qu'elles utilisent.

Vous allez effectuer un lookup sur le jeu de données emails_reference et extraire les informations concernant les domaines des adresses e-mail afin de les rapprocher des entreprise du jeu de données marketing_leads.

Avant de commencer

Pour effectuer une opération de lookup sur emails_reference, vous devez l'importer à l'aide du bouton Add dataset (Ajouter un jeu de données), dans la vue Datasets (Jeux de données) de la page d'accueil.

Procédure

  1. Sélectionnez la colonne sur laquelle effectuer le lookup, la colonne company dans cet exemple.
    Cette colonne se trouve dans le jeu de données source, ainsi que dans le jeu de données de référence. Il doit toujours y avoir une colonne commune aux deux jeux de données pour effectuer un lookup.
  2. Cliquez sur le bouton de lookup pour ouvrir le panneau de lookup.
  3. Cliquez sur le bouton et, dans la boîte de dialogue qui s'ouvre, sélectionnez le jeu de données à utiliser pour effectuer l'opération de lookup, le jeu de données emails_reference dans cet exemple.
  4. Cliquez sur Add.
  5. Dans la fenêtre de lookup qui s'ouvre dans la partie inférieure de votre écran, cliquez sur la colonne company_name.
  6. Cochez la case Add to Dataset (Ajouter).
  7. Placez votre pointeur sur le bouton Confirm (Confirmer) pour avoir un aperçu des modifications.
  8. Cliquez sur le bouton Confirm (Confirmer) pour appliquer ces modifications.

Résultats

La colonne email_domain est ajoutée au jeu de données marketing_leads, à côté de la colonne company.

Ces informations concernant les domaines d'adresses e-mail seront ajoutées aux prénoms et noms de famille des colonnes dupliquées, afin de créer des adresses e-mail complètes.