Etape 3 : définition du fichier de référence, mapping des données de référence, sélection du mode Inner Join - 7.0

Exemples de Jobs d'intégration de données

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Création de Jobs
EnrichPlatform
Studio Talend

Procédure

  1. Définissez la métadonnée correspondant au fichier LosAngelesandOrangeCounties.txt à l'aide de l'assistant, comme vous l'avez fait dans l'étape 1 avec le fichier California_clients.

    A l'étape 1 de l'assistant, nommez cette entrée de métadonnée : LA_Orange_cities.

  2. Puis déposez cette nouvelle métadonnée en haut de l'espace de modélisation, cela créera automatiquement un composant de lecture pointant vers cette métadonnée.
  3. Reliez ce composant au tMap.
  4. Double-cliquez de nouveau sur le composant tMap pour ouvrir son interface. Notez que la table de référence (row2) correspondant au fichier LosAngelesandOrangeCounties.txt, apparaît à gauche de la fenêtre dans la zone Input d'entrée, juste en dessus de votre flux d'entrée principal (row1).
  5. Maintenant, définissez la jointure entre le flux principal et le flux de référence.

    Dans ce scénario, la jointure est simple à définir puisque la colonne City est présente dans les deux fichiers d'entrée et que les données correspondent parfaitement. Mais si ça n'avait pas été le cas, il aurait été possible de rapprocher les données (padding, changement de casse, etc.) directement à ce niveau.

    Pour établir la jointure, déposez la colonne City de la première table d'entrée vers la colonne City de la table de référence. Un lien violet apparaît pour matérialiser cette jointure.

    Maintenant, vous pouvez utiliser la colonne County de la table de référence dans la table de sortie (out1).

  6. Enfin, cliquez sur le bouton OK pour valider les modifications et exécutez ce nouveau Job.

    La sortie suivante s'affichera dans la console :

    Comme vous pouvez le voir, la dernière colonne ne contient que les villes des régions d'Orange et de Los Angeles. Pour les autres villes, cette colonne reste vide. Ceci est dû au fait que par défaut le tMap établit une jointure Left Outer Join. Si vous souhaitez appliquer un filtre permettant de n'afficher que les données pour lesquelles une correspondance a été trouvée par le tMap, ouvrez le tMap cliquez sur le bouton tMap settings et sélectionnez Inner Join dans la liste Join Model sur la table de référence (row2).