Ajouter et relier les composants - 6.5

Guide de prise en main de Talend Open Studio for Big Data

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Open Studio for Big Data
task
Création et développement
Installation et mise à niveau
EnrichPlatform
Studio Talend
Les composants Pig à utiliser dans l'espace de modélisation graphique permettent de créer un processus Pig de transformation de données.

Avant de commencer

  • Vous devez avoir démarré votre Studio Talend et ouvert la perspective Integration.

  • Un Job vide a été créé comme décrit dans Créer le Job et s'ouvre dans l'espace de modélisation graphique.

Procédure

  1. Dans l'espace de modélisation graphique du Job, saisissez le nom du composant à utiliser et sélectionnez ce composant dans la liste qui s'affiche. Dans ce scénario, les composants sont deux tPigLoad, un tPigMap et deux tPigStoreResult.
    • Les deux tPigLoad sont utilisés pour charger les données des films et réalisateurs, respectivement, de HDFS dans le flux de données du Job.

    • Le tPigMap est utilisé pour transformer les données d'entrée.

    • Les tPigStoreResult écrivent les résultats dans des répertoires données dans HDFS.

  2. Double-cliquez sur le libellé d'un composant tPigLoad pour modifier ce libellé et saisissez movie comme nouveau nom.
  3. Répétez l'opération pour nommer le second tPigLoad director.
  4. Cliquez-droit sur le composant tPigLoad nommé movie et, dans le menu contextuel, sélectionnez Row > Pig combine et cliquez sur le tPigMap pour relier ce tPigLoad au tPigMap. Ceci forme le lien principal via lequel les données de films sont envoyées au tPigMap.
  5. Répétez l'opération pour relier le composant director au tPigMap, à l'aide d'un lien Row > Pig combine. Ceci est le lien Lookup via lequel les données des réalisateurs sont envoyées au tPigMap en tant que données de référence.
  6. Répétez l'opération pour connecter le tPigMap au premier tPigStoreResult, à l'aide d'un lien Row > Pig combine et, dans la boîte de dialogue qui s'ouvre, nommez ce lien out1, puis cliquez sur OK afin de valider ces modifications.
  7. Répétez ces opérations pour connecter le tPigMap à l'autre tPigStoreResult, à l'aide d'un lien Row > Pig combine que vous nommez reject.

Résultats

Le Job complet doit ressembler à ceci :