Charger le fichier de référence et configurer la jointure Inner Join - 7.1

Pig

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tPigJoin pour ouvrir sa vue Basic settings.
  2. Cliquez sur le bouton [...] du schéma principal pour ouvrir la boîte de dialogue Schema.
  3. Vérifiez que le schéma d'entrée a bien été récupéré du composant précédent. Si nécessaire, cliquez sur le bouton ->> pour copier toutes les colonnes du schéma d'entrée au schéma de sortie.
  4. Cliquez sur le bouton [+] sous la table de sortie pour ajouter de nouvelles colonnes, selon la structure des données du fichier de référence, groupId_ref (integer) et groupName (string) dans cet exemple. Cliquez ensuite sur OK pour fermer la boîte de dialogue.
  5. Cliquez sur le bouton [...] du schéma du flux de référence pour ouvrir la boîte de dialogue Schema.
  6. Cliquez sur le bouton [+] sous la table de sortie pour ajouter : groupId_ref (integer) et groupName (string), puis cliquez sur OK pour fermer la boîte de dialogue.
  7. Dans le champ Filename, spécifiez le chemin d'accès complet au fichier de référence.
  8. Cliquez sur le bouton [+] sous la table Join key pour ajouter une ligne et sélectionnez groupId et groupId_ref, respectivement dans les liste Input et Lookup afin de mettre en correspondance les données du flux d'entrée principal et celles du flux de référence, selon l'ID du groupe.
  9. Dans la liste Join Mode, sélectionnez inner-join.