Procédure
- Double-cliquez sur le Job Map/Reduce que vous venez de créer afin de l'ouvrir dans l'espace de modélisation graphique. La Palette de composants Map/Reduce s'ouvre et des composants peuvent être barrés, car ils n'ont pas de version Map/Reduce.
- Cliquez-droit sur chacun des composants en question et sélectionnez Delete afin de les supprimer.
-
Déposez un composant tHDFSInput et un tHDFSOutput dans l'espace de modélisation graphique. Le tHDFSInput lit les données à partir de la distribution Hadoop utilisée et le tHDFSOutput, remplaçant le tLogRow, écrit les données dans cette distribution.
Si vous partez d'un Job vierge, déposez également un tNormalize.
- Reliez le tHDFSInput au tNormalize à l'aide d'un lien Row > Main et acceptez le schéma provenant du tNormalize.
- Reliez également le tNormalize au tHDFSOutput à l'aide d'un lien Row > Main.