Accéder au contenu principal

Sélectionner les enregistrements des salaires supérieurs à la moyenne à l'aide d'un Job Map/Reduce

Ce scénario s'applique uniquement aux solutions Talend avec Big Data.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Ce scénario présente un Job à six composants, créé pour calculer le salaire moyen d'un jeu de données d'exemple et sélectionner les salaires supérieurs à la moyenne.

Les données d'exemple à utiliser sont déjà stockées dans le système HDFS à utiliser et se présentent comme suit :
1	Lyndon	1200	
2	Ronald	3500	
3	Ulysses	5000	
4	Harry	2000	
5	Garfield	1800	
6	James	3300	
7	Chester	4200	
8	Dwight	2200	
9	Jimmy	2800	
10	Herbert	3500

Le séparateur utilisé pour séparer les champs est /t et les trois colonnes des données d'exemple sont id, name et salary.

Vous pouvez utiliser le composant tHDFSOutput pour écrire les données d'exemple dans le système HDFS à utiliser. Pour plus d'informations, consultez tHDFSOutput.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !