Créer le Job MapReduce

Guide de prise en main de Talend Big Data Platform

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data Platform
task
Installation et mise à niveau
Création et développement
Qualité et préparation de données > Profiling de données
Qualité et préparation de données > Nettoyage de données
Un Job MapReduce Talend vous permet d'accéder aux et d'utiliser les composants MapReduce Talend afin de construire graphiquement des programmes MapReduce pour lire, transformer ou écrire des données.

Avant de commencer

  • Vous devez avoir démarré votre Studio Talend et ouvert la perspective Integration.

Procédure

  1. Dans la vue Repository, développez le nœud Job Designs, cliquez-droit sur le nœud Big Data Batch et sélectionnez Create folder dans le menu contextuel.
  2. Dans l'assistant New Folder, nommez le dossier de Jobs getting_started, puis cliquez sur Finish pour créer le dossier.
  3. Cliquez-droit sur le dossier getting_started et sélectionnez à nouveau Create folder.
  4. Dans l'assistant New Folder, nommez le nouveau dossier mapreduce et cliquez sur Finish pour créer le dossier.
  5. Cliquez-droit sur le dossier mapreducemapreduce et sélectionnez Create Big Data Batch Job.
  6. Dans l'assistant New Big Data Batch Job, sélectionnez MapReduce dans la liste déroulante Framework.
  7. Saisissez un nom pour le Job MapReduce et saisissez d'autres informations utiles.
    Par exemple, saisissez aggregate_movie_director_mr dans le champ Name.

Résultats

La Palette des composants MapReduce est disponible dans le Studio. Vous pouvez construire votre Job en utilisant cette Palette, ainsi que le nœud Metadata du Repository.