Relier les composants - 6.4

Pig

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
EnrichPlatform
Studio Talend

Procédure

  1. Dans la perspective Integration du Studio Talend , créez un Job vide, nommé Replicate par exemple, à partir du nœud Job Designs dans la vue Repository.
    Pour plus d'informations concernant la création d'un Job, consultez le Guide utilisateur du Studio Talend .
  2. Déposez un tPigLoad, un tPigReplicate, deux tPigSort et deux tPigStoreResult dans l'espace de modélisation graphique.
    Le composant tPigLoad lit des données du système HDFS donné. Les données d'exemple utilisées dans ce scénario se présentent comme suit :
    Andrew Kennedy;Mississippi
    Benjamin Carter;Louisiana
    Benjamin Monroe;West Virginia
    Bill Harrison;Tennessee
    Calvin Grant;Virginia
    Chester Harrison;Rhode Island
    Chester Hoover;Kansas
    Chester Kennedy;Maryland
    Chester Polk;Indiana
    Dwight Nixon;Nevada
    Dwight Roosevelt;Mississippi
    Franklin Grant;Nebraska
    L'emplacement des données dans ce scénario est le suivant /user/ychen/raw/Name&State.csv.
  3. Reliez les composants à l'aide de liens Row > Pig combine.