Effectuer une jointure sur deux fichiers à partir d'une correspondance exacte et sauvegarder le résultat dans un fichier local - 7.0

Pig

EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig

Ce scénario s'applique uniquement aux solutions Talend avec Big Data.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Ce scénario décrit un Job à quatre composants combinant les données d'un fichier d'entrée et d'un fichier de référence correspondant à une clé de jointure donnée, supprime les colonnes indésirables, puis sauvegarde le résultat final dans un fichier local.

Le fichier d'entrée principal contient les informations concernant des personnes : ID, prénom, nom de famille, ID de groupe et salaire, comme ci-dessous :

1;Woodrow;Johnson;3;1013.39
2;Millard;Monroe;2;8077.59
3;Calvin;Eisenhower;3;6866.88
4;Lyndon;Wilson;3;5726.28
5;Ronald;Garfield;2;4158.58
6;Rutherford;Buchanan;3;2897.00
7;Calvin;Coolidge;1;6650.66
8;Ulysses;Roosevelt;2;7854.78
9;Grover;Tyler;1;5226.88
10;Bill;Tyler;2;8964.66

Le fichier de référence contient uniquement les informations des ID de groupes ainsi que le nom des groupes :

1;group_A
2;group_B