Sélectionner des enregistrements de salaires supérieurs à la moyenne à l'aide d'un Job Map/Reduce - 7.1

Global variable

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Custom Code (Intégration) > Composants de variables globales
Gouvernance de données > Systèmes tiers > Composants Custom Code (Intégration) > Composants de variables globales
Qualité et préparation de données > Systèmes tiers > Composants Custom Code (Intégration) > Composants de variables globales
EnrichPlatform
Studio Talend

Ce scénario s'applique uniquement aux solutions Talend avec Big Data nécessitant souscription.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Ce scénario présente un Job à six composants, créé pour calculer le salaire moyen d'un ensemble de données d'exemple et sélectionner les salaires supérieurs à la moyenne.

Les données d'exemple à utiliser sont déjà stockées dans le système HDFS à utiliser et se présentent comme suit :
1	Lyndon	1200	
2	Ronald	3500	
3	Ulysses	5000	
4	Harry	2000	
5	Garfield	1800	
6	James	3300	
7	Chester	4200	
8	Dwight	2200	
9	Jimmy	2800	
10	Herbert	3500

Le séparateur utilisé pour séparer les champs est /t et les trois colonnes des données d'exemple sont id, name et salary.

Vous pouvez utiliser le composant tHDFSOutput pour écrire les données d'exemple dans le système HDFS à utiliser. Pour plus d'informations, consultez tHDFSOutput.