Filtrer des lignes de données selon une condition et sauvegarder le résultat dans un fichier local - 6.4

Pig

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
EnrichPlatform
Studio Talend

Ce scénario s'applique uniquement aux produits Talend avec Big Data.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Ce scénario décrit un Job à quatre composants filtrant une liste de clients afin de trouver les clients d'un pays spécifique et sauvegardant la liste qui en résulte dans un fichier local. Avant de filtrer les données d'entrée, les entrées en doublon sont supprimées de la liste.

Le fichier d'entrée contient trois colonnes : Name, Country et Age et contient des doublons, comme montré ci-dessous :
Mario;PuertoRico;49
Mike;USA;22
Ricky;PuertoRico;37
Silvia;Spain;20
Billy;Canada;21
Ricky;PuertoRico;37
Romeo;UK;19
Natasha;Russia;25
Juan;Cuba;23
Bob;Jamaica;55
Mario;PuertoRico;49