コンポーネントを設定 - Cloud - 8.0

処理(インテグレーション)

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント
データガバナンス > サードパーティーシステム > 変換処理コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント

手順

  1. [People]のラベルが付いたコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを表示します。
    警告:

    ダイナミックスキーマ機能は[Built-In] (組み込み)モードでのみサポートされており、ヘッダー行を付けるには入力ファイルが必要になります。

  2. [File Name/Stream] (ファイル名/ストリーム)の横にある[...]ボタンをクリックして、入力ファイルを参照します。
  3. ヘッダーとフッターの行を定義します。このユースケースでは、入力ファイルの最初の行がヘッダー行になります。
  4. [Edit schema] (スキーマを編集)をクリックし、このコンポーネントのスキーマを定義します。
    このユースケースでは、入力ファイルには[FirstName][LastName][HouseNo][Street]、および[City]の5つのカラムがあります。ここで、ダイナミックスキーマフィーチャーを活用するため、スキーマに1列ダイナミックカラムを定義します(この例ではDynaとします)。
    以下のようにします:
    1. [+]ボタンをクリックして、新しい行を追加します。
    2. [Column] (カラム)フィールドにDynaと入力します。
    3. [Type] (タイプ)リストから[Dynamic] (ダイナミック)を選択します。
    4. 次に、[OK]をクリックしてスキーマをプロパゲートさせ、[Schema] (スキーマ)ダイアログボックスを閉じます。
  5. [Split_Column]のラベルが付いたコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを表示します。
    このコンポーネントを使用して、入力スキーマのダイナミックカラムを2つのカラム (1つは名前、もう一方はファミリー関連情報) に分割します。これを行うには、次の手順に従います。
    1. [Edit schema] (スキーマを編集)をクリックして、[Schema] (スキーマ)ダイアログボックスを開きます。
    2. 出力パネルで、[+]ボタンをクリックして出力スキーマに2つのカラムを追加し、それぞれ[FirstName][FamilyInfo]という名前を付けます。
    3. [FirstName][Type] (タイプ)リストから[String] (文字列)を選択して、入力スキーマからこのカラムを抽出し、名前リストにファーストネームが表示されるようにします。
    4. FamilyInfoカラムに[Type] (タイプ)リストから[Dynamic] (動的)を選択して、このカラムに名前リストの各人の残りの情報が保持されるようにします。姓、家屋番号、通り、都市名、これらすべてを合わせて家族を特定します。
    5. 次に、[OK]をクリックしてスキーマをプロパゲートさせ、[Schema] (スキーマ)ダイアログボックスを閉じます。
  6. [Deduplicate] (重複除去)のラベルが付いたコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを表示します。
  7. [Unique key] (ユニークキー)エリアで、[FamilyInfo]カラムの[Key attribute] (キーの属性)チェックボックスをオンにして、家族情報の重複除去を実行します。
  8. [Deduplicated_Families]のラベルが付いたtFileOutputDelimitedコンポーネントの[Basic settings] (基本設定)ビューで、 出力ファイルのパスを定義し、[Include header] (ヘッダーを含める)チェックボックスをオンにして、その他の設定はそのままにします。
  9. [Duplicated_Families]というラベルが付いたtLogRowコンポーネントの[Basic settings] (基本設定)ビューで、[Table] (テーブル)オプションを選択して、ジョブ実行結果を表モードで表示します。