コンポーネントをリンク - 7.2

Pig

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント > Pig
データガバナンス > サードパーティーシステム > 変換処理コンポーネント > Pig
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント > Pig

手順

  1. Talend Studio[Integration] (インテグレーション)パースペクティブで、[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブデザイン)ノードから空のジョブを作成し、Replicateといった名前を付けます。
    ジョブを作成する方法の詳細は、Talend Studioユーザーガイドを参照してください。
  2. ワークスペース内にtPigLoadtPigReplicate、2つのtPigSort、2つのtPigStoreResultをドロップします。
    tPigLoadコンポーネントは特定のHDFSシステムからデータを読み取ります。このシナリオで使用するサンプルデータは、以下のように読み取られます:
    Andrew Kennedy;Mississippi
    Benjamin Carter;Louisiana
    Benjamin Monroe;West Virginia
    Bill Harrison;Tennessee
    Calvin Grant;Virginia
    Chester Harrison;Rhode Island
    Chester Hoover;Kansas
    Chester Kennedy;Maryland
    Chester Polk;Indiana
    Dwight Nixon;Nevada
    Dwight Roosevelt;Mississippi
    Franklin Grant;Nebraska
    このシナリオでは、データのロケーションは/user/ychen/raw/Name&State.csvとなります。
  3. [Row] (行) > [Pig Combine] (Pigの結合)リンクを使用してこれらを接続します。