Charger les données relatives aux événements - 7.1

Pig

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tPigLoad nommé event pour ouvrir sa vue Component.
  2. Cliquez sur le bouton à côté du champ Edit schema pour ouvrir l'éditeur de schéma.
  3. Cliquez trois fois sur le bouton pour ajouter trois lignes et, dans la colonne Column, renommez-les respectivement date, street et event.
  4. Cliquez sur OK pour valider ces modifications.
  5. Dans la zone Mode, sélectionnez Map/Reduce.
    Puisque vous avez déjà configuré la connexion à la distribution Hadoop, dans le premier composant tPigLoad nommé traffic, le composant event réutilise cette connexion. Ainsi, la Distribution et la Version sont automatiquement sélectionnées.
  6. Dans la liste Load function, sélectionnez la fonction PigStorage pour lire les données source.
  7. Dans le champ Input file URI, saisissez le chemin d'accès au répertoire dans lequel les données relatives aux événements sont stockées. Dans cet exemple, le chemin d'accès au répertoire est "/user/ychen/tpigmap/date&event".