データを集計およびソートするためのジョブを設定する - 7.3

処理(インテグレーション)

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント
データガバナンス > サードパーティーシステム > 変換処理コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント
tAggregateRowコンポーネントを使用して学生の総合スコアを集計し、集計されたデータをtSortRowコンポーネントを使用してソートするジョブを設定します。

手順

  1. tFixedFlowInputコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
  2. [Edit schema] (スキーマを編集)の横にあるボタンをクリックしてスキーマダイアログボックスを開き、String型のnameおよびDouble型のscoreの2つのカラムを追加してスキーマを定義します。完了したら、[OK]をクリックして変更を保存し、スキーマダイアログボックスを閉じます。
  3. [Mode] (モード)エリアで、[Use Inline Content(delimited file)] (インラインコンテンツの使用:区切りファイル)を選択し、表示された[Content] (コンテンツ)フィールドに次の入力データを入力します。
    Peter;92
    James;93
    Thomas;91
    Peter;94
    James;96
    Thomas;95
    Peter;96
    James;92
    Thomas;98
    Peter;95
    James;96
    Thomas;93
    Peter;98
    James;97
    Thomas;95
  4. tAggregateRowコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
  5. [Edit schema] (スキーマを編集)の横にあるボタンをクリックしてスキーマダイアログボックスを開き、String型のname、およびDouble型のsumaveragemaxminの5つのカラムを追加してスキーマを定義します。
    完了したら、[OK]をクリックして変更を保存し、スキーマダイアログボックスを閉じます。
  6. [Group by] (グループ化)テーブルの下にあるボタンをクリックして1つの行を追加し、[Output column] (出力カラム)カラムフィールドと[Input column position] (入力カラムの位置)カラムフィールドの両方からnameを選択して、入力データをnameカラムでグループ化します。
  7. [Operations] (操作)テーブルに4行を追加し、実行する操作を定義します。この例では、操作はsumaveragemaxminです。次に、4つの[Input column position] (入力カラムの位置)カラムフィールドすべてでscoreを選択して、それに基づいて入力データを集計します。
  8. tSortRowコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
  9. Criteriaテーブルに1行を追加し、ソート操作の実行のベースとなるカラムを指定します。この例ではnameカラムです。alpha[sort num or alpha?] (数値または文字でソート?)カラムフィールドから、ascOrder asc or desc?カラムフィールドから選択して、集計されたデータをアルファベットの昇順でソートします。
  10. tLogRowコンポーネントをダブルクリックして[Basic settings] (基本設定)ビューを開き、[Mode] (モード)エリアで[Table (print values in cells of a table)] (テーブル(テーブルのセルに値を表示))を選択します。これで結果の表示が改善します。