Sélectionner des enregistrements de salaires supérieurs à la moyenne à l'aide d'un Job Map/Reduce - 7.3

Sélection d'enregistrements de salaires supérieurs à la moyenne à l'aide d'un Job Map/Reduce

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Custom Code (Intégration) > Composants de variables globales
Gouvernance de données > Systèmes tiers > Composants Custom Code (Intégration) > Composants de variables globales
Qualité et préparation de données > Systèmes tiers > Composants Custom Code (Intégration) > Composants de variables globales

Ce scénario s'applique uniquement aux solutions Talend avec Big Data nécessitant une souscription.

Ce scénario présente un Job à six composants, créé pour calculer le salaire moyen d'un ensemble de données d'exemple et sélectionner les salaires supérieurs à la moyenne.

Les données d'exemple à utiliser sont déjà stockées dans le système HDFS à utiliser et se présentent comme suit :
1	Lyndon	1200	
2	Ronald	3500	
3	Ulysses	5000	
4	Harry	2000	
5	Garfield	1800	
6	James	3300	
7	Chester	4200	
8	Dwight	2200	
9	Jimmy	2800	
10	Herbert	3500

Le séparateur utilisé pour séparer les champs est /t et les trois colonnes des données d'exemple sont id, name et salary.

Vous pouvez utiliser le composant tHDFSOutput pour écrire les données d'exemple dans le système HDFS à utiliser. Pour plus d'informations, consultez tHDFSOutput.