Effectuer une jointure sur deux fichiers à partir d'une correspondance exacte et sauvegarder le résultat dans un fichier local - 6.4

Pig

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
EnrichPlatform
Studio Talend

Ce scénario s'applique uniquement aux produits Talend avec Big Data.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Ce scénario décrit un Job à quatre composants combinant les données d'un fichier d'entrée et d'un fichier de référence correspondant à une clé de jointure donnée, supprime les colonnes indésirables puis sauvegarde le résultat final dans un fichier local.

Le fichier d'entrée principal contient les informations concernant des personnes : ID, prénom, nom de famille, ID de groupe et salaire, comme ci-dessous :

1;Woodrow;Johnson;3;1013.39
2;Millard;Monroe;2;8077.59
3;Calvin;Eisenhower;3;6866.88
4;Lyndon;Wilson;3;5726.28
5;Ronald;Garfield;2;4158.58
6;Rutherford;Buchanan;3;2897.00
7;Calvin;Coolidge;1;6650.66
8;Ulysses;Roosevelt;2;7854.78
9;Grover;Tyler;1;5226.88
10;Bill;Tyler;2;8964.66

Le fichier de référence contient uniquement les informations des IDs de groupes ainsi que le nom des groupes :

1;group_A
2;group_B