Créer un Job pour mettre des données en correspondance - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Vous pouvez générer un Job afin de mettre en correspondance des données dans un fichier spécifique des métadonnées du Studio Talend avec une autre source de données.

Via les paramètres de ce Job automatiquement généré, vous pouvez choisir d'écrire en sortie la correspondance exacte et les valeurs ne correspondant pas, dans des fichiers séparés ou dans une base de données. Cependant, vous pouvez choisir d'écrire en sortie des correspondances possibles dans un fichier ou une base de données.

Pourquoi et quand exécuter cette tâche

La séquence de mise en correspondance des données par rapport à un fichier de référence comprend les étapes suivantes :

  1. Sélection du fichier contenant les données que vous souhaitez mettre en correspondance.
  2. Choix des colonnes sur lesquelles exécuter le Job de mise en correspondance.
  3. Si nécessaire, définition d'une clé de bloc pour partitionner les données à traiter. Une clé de bloc est généralement nécessaire lorsque le fichier comprend de nombreuses données.
  4. Choix de l'emplacement où écrire les correspondances exactes, possibles et les enregistrements ne correspondant pas.
  5. Exécution du Job généré.

Procédure

  1. Dans la barre de menu, sélectionnez Window > Show View.
    La boîte de dialogue Show View s'ouvre.
  2. Développez le dossier Help et sélectionnez Cheat Sheets.
  3. Cliquez sur OK pour fermer la boîte de dialogue.
    Le panneau Cheat Sheet s'affiche dans le Studio Talend.
  4. Dans la barre d'icônes aide-mémoire, cliquez sur la flèche déroulante et dans le menu contextuel, sélectionnez Launch Other....
    Emplacement de l'option Launch Other (Lancer autre) dans le panneau Cheat Sheets (Aide-mémoire).
    La boîte de dialogue Cheat Sheet Selection s'ouvre.
  5. Développez Talend - Cheat Sheets > Job et sélectionnez Match Data, puis cliquez sur OK pour fermer la boîte de dialogue.
    Emplacement de l'aide-mémoire Match Data (Rapprocher les données) dans la boîte de dialogue de sélection de l'aide-mémoire.

    La page correspondante s'ouvre dans le panneau Cheat Sheet. Cette page vous guide à travers les étapes de création d'un Job prêt à l'emploi sur certaines colonnes d'un fichier spécifique.

    Vue d'ensemble de l'aide-mémoire dans le panneau Cheat Sheet (Aide-mémoire).
  6. Lisez l'introduction puis cliquez sur Click to Restart.

    Cela va développer la première étape de la procédure : Select Input File (Sélectionner un fichier d'entrée).

  7. Lisez les instructions puis cliquez sur Click to perform.

    L'assistant Input Type Select Dialog s'ouvre et vous guide à travers les étapes de la création du Job.

  8. Dans le champ Type list, sélectionnez le type de fichier sur lequel vous souhaitez exécuter le Job. Cliquez sur OK afin de fermer la première étape de l'assistant.
    L'étape suivante de l'aide-mémoire est développée.
    Une boîte de dialogue s'ouvre et affiche les connexions aux bases de données et fichiers définis dans le Studio Talend.
  9. Sélectionnez le fichier à nettoyer dans la section Metadata > connections et cliquez sur OK.

    L'étape suivante de l'aide-mémoire est développée.

  10. Lisez les instructions concernant comment choisir la source de données de référence par rapport à laquelle vous souhaitez mettre en correspondance les données puis cliquez sur Click to perform pour ouvrir la vue suivante de l'assistant.
  11. Continuez à suivre les instructions et à passer de l'assistant aux étapes dans la page des aide-mémoire jusqu'à ce que vous arriviez à la dernière étape : Review and Run the Generated Job.

    L'assistant configure tous les composants et métadonnées du Repository selon les paramètres définis dans les différentes vues de l'assistant puis génère le Job. Le Studio Talend passe à la perspective Integration. Le Job doit ressembler à celui présenté dans la capture d'écran ci-dessous :

    Job utilisant plusieurs composants pour rapprocher des données.
  12. Sauvegardez le Job et appuyez sur F6 pour l'exécuter.

Résultats

Les correspondances exactes, possibles et les valeurs ne correspondant pas dans le fichier sont identifiées et stockées dans les sorties définies, fichiers ou base de données. Le Job généré est stocké sous le nœud Job Designs dans la vue Repository.