手順3: 参照ファイルの定義、再マッピング、内部結合モードの選択 - 7.0

Data Integrationジョブの例

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
ジョブデザインと開発 > ジョブデザイン
EnrichPlatform
Talend Studio

手順

  1. ウィザードを使用してLosAngelesandOrangeCounties.txtファイルに対して実行したように、California_clientsファイルに対応するメタデータを定義します。

    ウィザードの手順1で、このメタデータエントリにLA_Orange_citiesという名前を付けます。

  2. この新たに作成したメタデータをデザインエリア上にドロップすると、このメタデータをポイントする読み取りコンポーネントが自動的に作成されます。
  3. 次に、このコンポーネントをtMapコンポーネントにリンクさせます。
  4. tMapコンポーネントを再度ダブルクリックして、このコンポーネントのインタフェースを開きます。LA郡とオレンジ郡のファイルに対応する参照入力テーブル(row2)が、ウィンドウ左側のメイン入力(row1)の下に表示されます。
  5. 次に、メインフローと参照フローの間の結合を定義しましょう。

    このユースケースでは、[City] (都市)カラムが両方のファイルに存在しており、かつそのデータが完全に一致しているため、結合の定義はかなり基本的なものになります。ただし、このような場合でなくとも、このレベルで直接演算を実行して、データ間のリンクを確立できます(埋め込み、大文字小文字の変更など)。

    結合を実装するには、最初の入力テーブルの[City] (都市)カラムを、参照テーブルの[City] (都市)カラムにドロップします。紫色のリンクが表示され、この結合が実体化されます。

    これで、参照テーブルの[County] (郡)カラムを出力テーブル(out1)で使用できるようになりました。

  6. 最後に、[OK]をクリックして変更を確定し、新しいジョブを実行します。

    次のような出力がコンソールに表示されます。

    ご覧のとおり、最後のカラムには、ロサンゼルス郡とオレンジ郡の都市である場合のみ、値が存在しています。その他の行については、このカラムは空になっています。これは、デフォルトで、tMapが左側外部結合モードになっているからです。データをフィルター処理してtMapによって一致が見つかった行のみ表示する場合は、tMapを再度開き、[tMap settings] (tMap設定)ボタンをクリックして、参照テーブル(row2)の[Join Model] (結合モデル)リストで、[Inner Join] (内部結合)を選択します。