出力データの集計と計算を行う - 7.2

Machine Learning

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 機械学習コンポーネント
データガバナンス > サードパーティーシステム > 機械学習コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 機械学習コンポーネント

手順

  1. 最初のtAggregateRowをダブルクリックして、[Basic settings] (基本設定)ビューを表示し、コンポーネントのプロパティを定義します。
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、出力フローを定義します。
  3. 入力スキーマのカラムを出力スキーマに移動してから、[+]ボタンをクリックして、出力スキーマに新しいカラムを追加します。これにcountという名前を付けます。
    完了したら、[OK]をクリックしてダイアログボックスを閉じます。
  4. [Group by] (グルーピング)セクションで[+]ボタンをクリックして、必要な数の行を追加します。ここでは、グルーピングの値を定義できます。
    • [Output column] (出力カラム)行をクリックし、集計データを保持する出力カラム、この例ではregionカラムを選択します。

    • 最初の[Input column position] (入力カラムの位置)行をクリックし、集計する値を収集する入力カラム、この例ではregionカラムを選択します。

  5. [Operations] (操作)セクションで[+]ボタンをクリックし、集計データを保持するカラムの行を追加します。ここで、計算値を定義できます。
    • [Output column] (出力カラム)行をクリックし、宛先カラム、この例ではcountカラムをリストから選択します。

    • [Function] (関数)カラムの行をクリックし、リスト表示された操作のいずれかを選択します。

      この例では、クライアントの数をその地域に基づいてカウントし、出力カラムに1回だけリスト表示します。

    • [Input column position] (入力カラムの位置)行をクリックし、集計する値を収集する入力カラム、この例ではregionカラムを選択します。

  6. 2番目のtAggregateRowコンポーネントをダブルクリックし、同じように、その基本設定を定義して、channelカラムに基づいて2番目のクラスター内のクライアント数をカウントします。