参照ファイルをロードして内部Joinを設定 - 7.2

Pig

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント > Pig
データガバナンス > サードパーティーシステム > 変換処理コンポーネント > Pig
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント > Pig

手順

  1. tPigJoinをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
  2. メインスキーマの[...]をクリックして、[Schema] (スキーマ)ダイアログボックスを開きます。
  3. 入力スキーマが前のコンポーネントから正しく取得されていることを確認します。必要に応じて、[->>]ボタンをクリックして、すべてのカラムを入力スキーマから出力スキーマにコピーします。
  4. 出力パネルの下にある[+]ボタンをクリックし、参照ファイルのデータストラクチャーに従って、新しいカラム(この例では、groupId_ref (整数)とgroupName (文字列))を追加します。[OK]をクリックして、ダイアログボックスを閉じます。
  5. スキーマルックアップフローの[...]をクリックして、[Schema] (スキーマ)ダイアログボックスを開きます。
  6. 出力パネルの下にある[+]ボタンをクリックし、groupId_ref (整数)とgroupName (文字列)という2つのカラムを追加した後に、[OK]をクリックしてダイアログボックスをを閉じます。
  7. [Filename] (ファイル名)フィールドで、参照ファイルへの完全パスを指定します。
  8. [Join key] (結合キー)テーブルの下にある[+]ボタンをクリックし、新しい行を追加します。そして、[Input] (入力)リストと[Lookup] (ルックアップ)リストからgroupIdgroupId_refをそれぞれ選択して、グループIDに基づいてメイン入力フローからのデータをルックアップフローからのデータと一致させます。
  9. [Join Mode] (結合モード)リストから、inner-joinを選択します。