Configurer le tPigStoreResult - 6.4

Pig

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration) > Composants Pig
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Deux composants tPigStoreResult sont utilisés pour écrire les données triées dans HDFS.

Procédure

  1. Double-cliquez sur le premier composant tPigStoreResult pour ouvrir sa vue Component et écrire les données triées par nom.
  2. Dans le champ Result file, saisissez le répertoire dans lequel les données seront écrites. Ce répertoire sera créé s'il n'existe pas. Dans ce scénario, le répertoire est le suivant /user/ychen/sort/tPigreplicate/byName.csv.
  3. Sélectionnez Remove result directory if exists.
  4. Dans la liste Store function, sélectionnez PigStorage.
  5. Dans le champ Field separator, saisissez ;.
  6. Répétez l'opération pour l'autre composant tPigStoreResult mais sélectionnez un répertoire différent pour les données triées par état. Dans ce scénario, le répertoire est le suivant /user/ychen/sort/tPigreplicate/byState.csv.