マッピングを設定してジョブを実行 - 8.0

Talend Data Management Platform 入門ガイド

Version
8.0
Language
日本語
EnrichDitaval
Data Management Platform
Product
Talend Data Management Platform
Module
Talend Administration Center
Talend Installer
Talend Runtime
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング

以下の手順は、有効なディレクターIDを持つ映画情報を出力するようにマッピングと内部結合を設定する方法を説明しています。

手順

  1. tMapコンポーネントをダブルクリックして、マップエディターを開きます。

    マップエディターには、(このサンプルでは) row1row2Valid_moviesと名付けられている3つのテーブルが表示されます。3つのテーブルはそれぞれ、映画ファイルスキーマ、ディレクターファイルスキーマ、有効な映画情報の出力スキーマに対応しており、row1テーブルのカラムはValid_moviesテーブルのカラムにマップ済みです。

  2. row1テーブルのdirectorIDカラムを選択し、row2テーブルのdirectorIDカラムにドロップして、ディレクターIDに基づいて2つの入力データセットの間に結合を作成します。
  3. [tMap settings] (tMap設定)ボタンをクリックし、[Join Model] (結合モデル)[Value] (値)フィールドをクリックし、表示される[...]ボタンをクリックして[Options] (オプション)ダイアログボックスを開きます。ダイアログボックスで[Inner Join] (内部結合)を選択し、[OK]をクリックして結合を内部結合として定義します。

    この設定では、ディレクターIDが参照ファイル内のディレクターIDと一致する映画レコードのみが出力に渡されます。

  4. マップエディターの下部にある[Schema editor] (スキーマエディター)で出力スキーマのdirectorIDカラムを選択し(このサンプルではValid_movies)、[X]ボタンをクリックして削除します。
  5. 出力テーブルの下の[+]ボタンをクリックして新しいカラムを追加し、directedByという名前を付け、長さを20に設定し、[title] (タイトル)カラムとreleaseYearカラムの間に来るように上に移動します。
  6. row2テーブルでdirectorNameカラムを選択し、出力テーブルのdirectedByカラムに対応する[Expression] (式)フィールドにドロップします。

    新しいマッピングがルックアップテーブルと出力テーブルの間に作成されます。

  7. [OK]をクリックしてマッピングを確定し、マップエディターを閉じ、変更をプロパゲートするかどうかを尋ねるメッセージが表示されたら、[Yes] (はい)をクリックします。

    マッピング設定が保存され、出力スキーマが出力コンポーネントtLogRowに同期します。

  8. [Run] (実行)ビューでF6を押すか[Run] (実行)ボタンをクリックして、ジョブを実行します。

タスクの結果

[Run] (実行)コンソールには、有効なディレクター情報のある映画レコードのみが表示されます。