Compter le nombre de mots à l'aide de codes Map et Reduce personnalisés - 7.2

Custom Code Java pour Map Reduce

EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Custom Code (Intégration) > Composant Custom Code Java pour Map Reduce
Gouvernance de données > Systèmes tiers > Composants Custom Code (Intégration) > Composant Custom Code Java pour Map Reduce
Qualité et préparation de données > Systèmes tiers > Composants Custom Code (Intégration) > Composant Custom Code Java pour Map Reduce

Ce scénario s'applique uniquement aux solutions Talend avec Big Data nécessitant souscription.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

En se basant sur l'exemple MapReduce présenté dans la documentation Apache sur http://wiki.apache.org/hadoop/WordCount (en anglais), ce scénario montre comment utiliser le composant tJavaMR afin de créer un programme MapReduce permettant de compter le nombre de mots.

Les données d'exemple utilisées dans ce scénario se présentent comme suit :
Hello world goodbye world
Hello hadoop bye Hadoop

Avant de commencer à reproduire ce scénario, assurez-vous d'avoir les droits d'accès appropriés à la distribution Hadoop à utiliser. Procédez comme suit :