コンポーネントをリンク - 7.2

Pig

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント > Pig
データガバナンス > サードパーティーシステム > 変換処理コンポーネント > Pig
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント > Pig

手順

  1. Talend Studio[Integration] (インテグレーション)パースペクティブで、[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブデザイン)ノードから空のジョブを作成し、pigweatherといった名前を付けます。
    ジョブを作成する方法の詳細は、Talend Studioユーザーガイドをご覧ください。
  2. ワークスペース内に2つのtPigLoadコンポーネント、 tPigMap、2つのtPigStoreResultをドロップします。
    必要に応じて、コンポーネントにラベルを付けることができます。このシナリオでは、交通データおよび関連するイベントデータをロードする2つのtPigLoadコンポーネントにそれぞれtrafficeventというラベルを付けます。次に、使用されるHadoopディストリビューションに結果を従って書き込む2つのtPigStoreResultコンポーネントにnormaljamというラベルをそれぞれ付けます。コンポーネントにラベル付けする方法は、Talend Studioユーザーガイドをご覧ください。
  3. trafficというラベルの付いたtPigLoadコンポーネントを右クリックして、コンテキストメニューからの[Row] (行) > [Pig combine] (Pigの結合)リンクを使って、tPigMapに接続します。
  4. この操作を繰り返し、eventというラベルの付いたtPigLoadコンポーネントもtPigMapにリンクします。2番目の作成されるリンクであるため、自動的にルックアップリンクになります。
  5. [Row] (行) > [Pig combine] (Pigの結合)リンクをもう一度使って、tPigMapを2つのtPigStoreResult各コンポーネントに接続します。
    コンテクストメニューからリンクタイプを選択すると、表示されたダイアログボックスでそれらのリンクに名前を付ける必要があります。このシナリオでは、normalというラベルの付いたtPigStoreResultへのリンクにoutという名前を、jamというラベルの付いたtPigStoreResultへのリンクにrejectという名前を付けます。