Procédure
- Double-cliquez sur le Job Map/Reduce que vous venez de créer afin de l'ouvrir dans l'espace de modélisation graphique. La Palette de composants Map/Reduce s'ouvre et des composants peuvent être barrés, car ils n'ont pas de version Map/Reduce.
- Cliquez-droit sur chacun des composants en question et sélectionnez Delete afin de les supprimer.
-
Déposez un composant tHDFSInput et un tHDFSOutput dans l'espace de modélisation graphique. Le tHDFSInput lit les données à partir de la distribution Hadoop utilisée et le tHDFSOutput écrit les données dans cette distribution.
Si vous partez d'un Job vierge, déposez également un tReplace et un tFilterColumns.
- Reliez le tHDFSInput au tReplace à l'aide d'un lien Row > Main et acceptez le schéma provenant du tReplace.
- Reliez le tFilterColumns au tHDFSOutput à l'aide d'un lien Row > Main.