Charger les données d'exemple relatives aux étudiants et leurs amis - 6.4

Pig

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le second tPigLoad pour ouvrir sa vue Component.
  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur du schéma.
  3. Cliquez deux fois sur le bouton [+] pour ajouter deux lignes et, dans la colonne Column, renommez-les student et friend, respectivement.
  4. Cliquez sur OK pour valider ces modifications et acceptez la propagation proposée par la boîte de dialogue qui s'ouvre.
  5. Dans la zone Mode, sélectionnez Map/Reduce.
    Ce composant réutilise la connexion à Hadoop configurée dans le composant principal tPigLoad. Les listes Distribution et Version ont été automatiquement renseignées avec les valeurs du composant principal de chargement.
  6. Dans la liste Load function, sélectionnez la fonction PigStorage pour lire les données source.
  7. Dans le champ Input file URI, saisissez le répertoire où sont stockées les données source. Comme expliqué précédemment, ces données de la seconde relation contiennent les données des étudiants et de leurs amis.