Procédure
-
Double-cliquez sur le tPigLoad afin d'ouvrir sa vue Basic settings.
- Afin d'utiliser une connexion à HDFS centralisée, ouvrez la liste Property Type et sélectionnez Repository. Cliquez ensuite [...] afin d'ouvrir la boîte de dialogue [Repository Content].
-
Sélectionnez la connexion à HDFS définie pour la connexion à la base de données HDFS puis cliquez sur OK.
Tous les détails de connexion sont automatiquement saisis dans les champs appropriés.
- Sélectionnez le schéma générique de access_log depuis le Repository et déposez-le sur le composant afin d'appliquer le schéma.
- Dans la liste Load function, sélectionnez PigStorage et saisissez, dans le champ Input file URI le chemin défini dans le Job précédent, /user/hdp/weblog/access_log/out.log dans cet exemple.