抽出された情報の集約 - 7.3

Java custom code for Storm

Version
7.3
Language
日本語 (日本)
Product
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > カスタムコードコンポーネント > Storm向けJavaカスタムコードコンポーネント
データガバナンス > サードパーティーシステム > カスタムコードコンポーネント > Storm向けJavaカスタムコードコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > カスタムコードコンポーネント > Storm向けJavaカスタムコードコンポーネント

手順

  1. tAggregateRowをダブルクリックして、[Component] (コンポーネント)ビューを開きます。このコンポーネントにより、受信したメッセージに記録されている最も人気のあるアクティビティを見つけることができます。
  2. [Edit schema] (スキーマを編集)の横の[...]ボタンをクリックし、スキーマエディターを開きます。
  3. 出力側(右側)で[+]ボタンを3回クリックして3つの行を追加し、[Column] (カラム)カラムで3つの行の名前をそれぞれ、activitygenderpopularityに変更します。
  4. 出力側の[popularity] (人気)行の[Type] (タイプ)カラムで、[Double] (倍数)を選択します。
  5. [OK]をクリックしてこれらの変更を確認し、ポップアップ表示されるダイアログボックスで求められるプロパゲーションを承認します。
  6. [Group by] (グループ化)テーブルで[+]ボタンを2回クリックして2つの行を追加し、これら2つの行を以下のように設定して、出力されたデータをグループ化します。

    カラム

    [Description] (説明)

    出力カラム

    出力されたデータをグループ化する条件として使うカラムを出力スキーマから選択します。この例では、activitygenderです。

    入力カラムの位置

    [Output column] (出力カラム)カラムで選択した出力カラムにデータを送信するカラムを入力スキーマから選択します。このシナリオでは、activitygenderです。

  7. [Operations] (操作)テーブルで[+]ボタンを1回クリックして1行を追加し、この行を以下のように設定して、各アクティビティの人気を計算します。

    カラム

    [Description] (説明)

    出力カラム

    計算結果を載せるカラムを出力スキーマから選択します。このシナリオでは、popularityです。

    関数

    受信データの処理に使う関数を選択します。このシナリオでは、countを選択します。受信したメッセージに含まれる各アクティビティの頻度がカウントされます。

    入力カラムの位置

    処理するデータを提供するカラムを入力スキーマから選択します。このシナリオでは、activityです。