Configurer le mapping et exécuter le Job - 7.1

Guide de prise en main de Talend Data Management Platform

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Management Platform
task
Création et développement
Installation et mise à niveau
Qualité et préparation de données > Nettoyage de données
Qualité et préparation de données > Profiling de données
EnrichPlatform
Studio Talend
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime

La procédure ci-dessous vous apprend à configurer les mappings et les jointures Inner Join pour écrire en sortie les informations relatives aux films ayant un ID de réalisateur valide.

Procédure

  1. Double-cliquez sur le composant tMap pour ouvrir son éditeur de mapping.

    L'éditeur de mapping affiche trois tables, nommées row1, row2 et Valid_movies dans cet exemple, correspondant respectivement au schéma du fichier des films, au schéma du fichier des réalisateurs et au schéma de sortie des informations valides. Les colonnes de la table row1 sont déjà mappées aux colonnes de la table Valid_movies.

  2. Sélectionnez la colonne directorID de la table row1 et glissez-la sur la colonne directorID dans la table row2 afin de créer une jointure entre les deux ensembles de données basée sur l'ID des réalisateurs.
  3. Cliquez sur le bouton tMap settings (représentant une clé anglaise), cliquez sur le champ Value pour Join Model, puis cliquez sur le bouton [...] qui s'affiche pour ouvrir la boîte de dialogue Options. Dans la boîte de dialogue, sélectionnez Inner Join et cliquez sur OK pour définir la jointure comme Inner Join.

    Grâce à ce paramètre, seuls les enregistrements de films dont l'ID du réalisateur correspond à ceux du fichier de référence seront passés au composant de sortie.

  4. Dans la zone Schema editor au bas de l'éditeur de mapping, sélectionnez la colonne directorID du schéma de sortie, Valid_movies dans cet exemple, et cliquez sur le bouton [x] afin de la supprimer.
  5. Cliquez sur le bouton [+] sous la table de sortie pour ajouter une colonne, nommez-la directedBy, configurez sa longueur Length à 20, puis déplacez-la pour la placer entre title et releaseYear.
  6. Sélectionnez la colonne directorName de la table row2 et glissez-la dans le champ Expression correspondant à la colonne directedBy dans la table de sortie.

    Un nouveau mapping est créé entre la table de référence et la table de sortie.

  7. Cliquez sur OK pour valider les mappings et fermer l'éditeur, puis cliquez sur Yes lorsqu'il vous est proposé de propager les modifications.

    La configuration des mappings est sauvegardée et le schéma de sortie est synchronisé au composant de sortie tLogRow.

  8. Appuyez sur F6 ou cliquez sur le bouton Run de la vue Run pour exécuter votre Job.

Résultats

Seuls les enregistrements de films ayant des informations valides relatives aux réalisateurs sont affichées dans la console de la vue Run.