顧客情報を集計して購入を計算 - Cloud

Talend Cloud Pipeline Designerプロセッサーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発 > パイプラインのデザイン
EnrichPlatform
Talend Pipeline Designer

始める前に

  • ソースデータを保管するシステムへの接続が作成済みであること。

  • ソースデータを保管するデータセットが追加済みであること。

    これが、ID、製品情報(このドキュメントに添付されている書籍のタイトルや価格など)を含む顧客データの階層リストです(このページの左側のパネルにある[Downloads] (ダウンロード)タブから、aggregate-customers.jsonファイルをダウンロードします)。

  • 接続および処理済みデータを保管する関連データセットも作成済みであること。

    これが、HDFSに保存されているファイルです。

手順

  1. [Pipelines] (パイプライン)ページで[ADD PIPELINE] (パイプラインの追加)をクリックします。新しいパイプラインが開きます。
  2. パイプラインに意味のある名前を付けます。

    例え

    Aggregate Customer Data to Calculate Purchases
  3. [ADD SOURCE] (ソースの追加)をクリックして、ソースデータを選択できるパネルを開きます。ここでは、書籍の購入に関する階層顧客データです。

    例え

  4. データセットを選択し、[SELECT] (選択)をクリックしてパイプラインに追加します。
    必要であれば名前を変更します。
  5. をクリックして、パイプラインに[Aggregate] (集計)プロセッサーを追加します。設定パネルが開きます。
  6. プロセッサーに意味のある名前を付けます。

    例え

    calculate customer purchases
  7. [GROUP BY] (分類基準)エリアで、集計セットに使用するフィールドを選択します。ここでは.customerIdです。
  8. [OPERATIONS] (オペレーション)エリアで以下のようにします:
    1. [Field path] (フィールドパス)リストで.customerId[Operation] (オペレーション)リストで[Count] (カウント)を選択します。
    2. 生成されたフィールド([Output field name] (出力フィールド名))に、たとえばnbOfPurchasesという名前を付けます。
    3. [NEW ELEMENT] (新規エレメント)を追加し、[Field path] (フィールドパス)リストで.product.price[Operation] (オペレーション)リストで[Sum] (合計)を選択します。
    4. 生成されたフィールドに、たとえばtotalPriceという名前を付けます。
    5. [NEW ELEMENT] (新規エレメント)を追加し、[Field Path] (フィールドパス)リストで.product.name[Operation] (オペレーション)リストで[List] (リスト)を選択します。
    6. 生成されたフィールドに、たとえばbooksという名前を付けます。
  9. [Save] (保存)をクリックして設定を保存します。

    集計オペレーション後に計算されたデータ、つまり顧客ごとの書籍数および支出金額をプレビューできます。

  10. パイプラインの[ADD DESTINATION] (デスティネーションの追加)アイテムをクリックしてパネルを開くと、出力データ(HDFS)を保持する[Dataset] (データセット)を選択できます。

    必要であれば名前を変更します。

  11. Talend Cloud Pipeline Designerの上部のツールバーで、リストから実行プロファイルを選択します(詳細は実行プロファイルを参照してください)。
  12. 実行アイコンをクリックしてパイプラインを実行します。

タスクの結果

パイプラインは実行中で、購入は顧客ごとに集計され、出力フローは指定のターゲットシステムに送信されます。