Accéder au contenu principal

Comptage du nombre de mots à l'aide de codes Map et Reduce personnalisés (déprécié)

Availability-noteDéprécié·e

Ce scénario s'applique uniquement aux solutions Talend avec Big Data.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

En se basant sur l'exemple MapReduce présenté dans la documentation Apache sur http://wiki.apache.org/hadoop/WordCount (en anglais), ce scénario montre comment utiliser le composant tJavaMR afin de créer un programme MapReduce permettant de compter le nombre de mots.

Les données d'exemple utilisées dans ce scénario se présentent comme suit :
Hello world goodbye world
Hello hadoop bye Hadoop

Avant de commencer à reproduire ce scénario, assurez-vous d'avoir les droits d'accès appropriés à la distribution Hadoop à utiliser. Procédez comme suit :

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !