スコアを集計する - 7.0

スコアの集計とソートを行うジョブスクリプトを作成する

EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend CommandLine
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > カスタムコードコンポーネント > Javaカスタムコードコンポーネント
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き
ジョブデザインと開発 > サードパーティーシステム > プロセス制御コンポーネント
ジョブデザインと開発 > サードパーティーシステム > ロギングコンポーネント
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント
データガバナンス > サードパーティーシステム > カスタムコードコンポーネント > Javaカスタムコードコンポーネント
データガバナンス > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き
データガバナンス > サードパーティーシステム > プロセス制御コンポーネント
データガバナンス > サードパーティーシステム > ロギングコンポーネント
データガバナンス > サードパーティーシステム > 変換処理コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > カスタムコードコンポーネント > Javaカスタムコードコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き
データクオリティとプレパレーション > サードパーティーシステム > プロセス制御コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > ロギングコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント

スコアを集計するtAggregateRowコンポーネントを追加するには、次の手順に従います。

手順

  1. tUniteコンポーネントの次に、新しいtAggregateRowコンポーネントを追加します。
    addComponent {
    	setComponentDefinition {
    		TYPE: "tAggregateRow",
    		NAME: "tAggregateRow_1",
    		POSITION: 512, 192
    	}
    
    }
  2. tAggregateRowsetComponentDefinition {}の後に、setSettings {}関数を使ってコンポーネントのプロパティを定義します。

    この例では、aggregateのラベルの付いたtAggregateRowコンポーネントが、sumavgmaxminの各計算を実行して、各subjectの総合得点、平均点、最高点、最低点を取得します。

    	setSettings {
    		GROUPBYS {
    			OUTPUT_COLUMN : "subject",
    			INPUT_COLUMN : "subject"
    		},
    		OPERATIONS {
    			OUTPUT_COLUMN : "sum",
    			FUNCTION : "sum",
    			INPUT_COLUMN : "score",
    			OUTPUT_COLUMN : "average",
    			FUNCTION : "avg",
    			INPUT_COLUMN : "score",
    			OUTPUT_COLUMN : "max",
    			FUNCTION : "max",
    			INPUT_COLUMN : "score",
    			OUTPUT_COLUMN : "min",
    			FUNCTION : "min",
    			INPUT_COLUMN : "score"
    		},
    		LABEL : "aggregate"
    	}
  3. setSettings {}の次に、addSchema {}関数を入力して、コンポーネントの出力構造を定義します。

    この例では、tAggregateRowコンポーネントは次の5つのカラムを出力します。

    • subject: String型。
    • sum: 各教科の総合得点。Double型。
    • average: 各教科の平均点。Double型。
    • max: 各教科の最高点。Double型。
    • min: 各教科の最低点。Double型。
    	addSchema {
    		NAME: "tAggregateRow_1",
    		CONNECTOR: "FLOW"
    		addColumn {
    			NAME: "subject",
    			TYPE: "id_String"
    		}
    		addColumn {
    			NAME: "sum",
    			TYPE: "id_Double",
    			PRECISION: 2
    		}
    		addColumn {
    			NAME: "average",
    			TYPE: "id_Double",
    			PRECISION: 2
    		}
    		addColumn {
    			NAME: "max",
    			TYPE: "id_Double",
    			PRECISION: 2
    		}
    		addColumn {
    			NAME: "min",
    			TYPE: "id_Double",
    			PRECISION: 2
    		}
    	}