参照ファイルをロードして内部Joinを設定 - 7.2
Pig
- Version
- 7.2
- Language
- 日本語 (日本)
- Product
- Talend Big Data
- Talend Big Data Platform
- Talend Data Fabric
- Talend Open Studio for Big Data
- Talend Real-Time Big Data Platform
- Module
- Talend Studio
- Content
- ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント > Pig
- データガバナンス > サードパーティーシステム > 変換処理コンポーネント > Pig
- データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント > Pig
手順
-
tPigJoinをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
-
メインスキーマの[...]をクリックして、[Schema] (スキーマ)ダイアログボックスを開きます。
-
入力スキーマが前のコンポーネントから正しく取得されていることを確認します。必要に応じて、[->>]ボタンをクリックして、すべてのカラムを入力スキーマから出力スキーマにコピーします。
-
出力パネルの下にある[+]ボタンをクリックし、参照ファイルのデータストラクチャーに従って、新しいカラム(この例では、groupId_ref (整数)とgroupName (文字列))を追加します。[OK]をクリックして、ダイアログボックスを閉じます。
-
スキーマルックアップフローの[...]をクリックして、[Schema] (スキーマ)ダイアログボックスを開きます。
-
出力パネルの下にある[+]ボタンをクリックし、groupId_ref (整数)とgroupName (文字列)という2つのカラムを追加した後に、[OK]をクリックしてダイアログボックスをを閉じます。
-
[Filename] (ファイル名)フィールドで、参照ファイルへの完全パスを指定します。
-
[Join key] (結合キー)テーブルの下にある[+]ボタンをクリックし、新しい行を追加します。そして、[Input] (入力)リストと[Lookup] (ルックアップ)リストからgroupIdとgroupId_refをそれぞれ選択して、グループIDに基づいてメイン入力フローからのデータをルックアップフローからのデータと一致させます。
-
[Join Mode] (結合モード)リストから、inner-joinを選択します。