動的スキーマに基づいて値を集計するジョブを設定する - 7.3

処理(インテグレーション)

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント
データガバナンス > サードパーティーシステム > 変換処理コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント

tAggregateRowコンポーネントを使用して、動的スキーマカラムに基づいてCSVファイルにいくつかのタスク割り当てデータを集計するようにジョブを設定します。

次に、このジョブは、tLogRowコンポーネントを使用して集計データをコンソールに表示し、tFileOutputDelimitedコンポーネントを使用して出力CSVファイルに書き込みます。

手順

  1. tFileInputDelimitedコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
  2. [File name/Stream] (ファイル名/ストリーム)フィールドに、次のタスク割り当てデータを保持するCSVファイルへのパスを指定します。この例ではD:/tasks.csvです。
    task;team;status
    task1;team1;done
    task2;team2;done
    task3;team1;done
    task4;team2;pending
    task5;team1;pending
    task6;team2;pending
  3. ファイルの先頭でスキップする行数を[Header] (ヘッダー)フィールドに入力します。この例では1です。
    動的スキーマ機能は[Built-In] (組み込み)モードでのみサポートされており、ヘッダー行を付けるには入力ファイルが必要になります。
  4. [Edit schema] (スキーマを編集)の横にあるボタンをクリックしてスキーマダイアログボックスを開き、String型のtaskおよびDynamic型のotherの2つのカラムを追加してスキーマを定義します。完了したら、[OK]をクリックして変更を保存し、スキーマダイアログボックスを閉じます。
    ダイナミックカラムはスキーマの最後の行で定義する必要があります。動的スキーマの詳細は、 Talend Studioユーザーガイドを参照してください。
  5. tAggregateRowコンポーネントをダブルクリックし、[Basic settings] (基本設定)ビューで[Sync columns] (カラムの同期)ボタンをクリックして、先行コンポーネントからスキーマを取得します。
  6. [Group by] (グループ化)テーブルの下にあるボタンをクリックして1つの行を追加し、[Output column] (出力カラム)カラムフィールドと[Input column position] (入力カラムの位置)カラムフィールドの両方からotherを選択して、入力データをotherダイナミックカラムでグループ化します。
    ダイナミックカラム集計は、グループ化操作に対してのみ実行できます。
  7. [Operations] (操作)テーブルに1行を追加し、実行する操作を定義します。この例では、操作関数はlistです。次に、[Output column] (出力カラム)カラムフィールドと[Input column position] (入力カラムの位置)カラムフィールドの両方からtaskを選択して、グループ化結果のtaskカラムのエントリをリスト表示します。
  8. tLogRowコンポーネントをダブルクリックして[Basic settings] (基本設定)ビューを開き、[Mode] (モード)エリアで[Table (print values in cells of a table)] (テーブル(テーブルのセルに値を表示))を選択します。これで結果の表示が改善します。
  9. tFileOutputDelimitedコンポーネントをダブルクリックして[Basic settings] (基本設定)ビューを開き、集計したデータを書き込むCSVファイルへのパスを[File Name] (ファイル名)フィールドに指定します。この例では D:/tasks_aggregated.csvです。
  10. 各カラムのヘッダーをCSVファイルに含めるには、[Include Header] (ヘッダーを含む)チェックボックスをオンにします。