顧客の行動に関する調査レコードの再編成 - Cloud

Talend Cloud Pipeline Designerプロセッサーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発 > パイプラインのデザイン
EnrichPlatform
Talend Pipeline Designer

始める前に

  • ソースデータを保管するデータセットが追加済みであること。

    ここでは、顧客の行動に関する調査のデータセット(XまたはYのデバイス顧客のタイプなど)を使用します。このページの左側のパネルにある[Downloads] (ダウンロード)タブから、対応するfield_selector-customers.jsonファイルをダウンロードします。

  • 接続および処理済みデータを保管する関連データセットも作成済みであること。

    ここでは、ファイルはHDFSに保存されているものとします。

手順

  1. [Pipelines] (パイプライン)ページで[ADD PIPELINE] (パイプラインの追加)をクリックします。新しいパイプラインが開きます。
  2. パイプラインに意味のある名前を付けます。

    例え

    Restructure Customer Schema
  3. [ADD SOURCE] (ソースの追加)をクリックし、ソースデータを選択できるパネルを開きます。ここでは、テストデータセットとして手動で入力された顧客のテーブルです。

    例え

  4. データセットを選択し、[SELECT] (選択)をクリックしてパイプラインに追加します。
    必要であれば名前を変更します。
  5. をクリックし、パイプラインにField selectorプロセッサーを追加します。設定パネルが開きます。
  6. プロセッサーに意味のある名前を付けます。

    例え

    フィールドの再構成
  7. [SELECTORS] (セレクター)エリアで次の操作を行います。
    1. idフィールドを同じ場所に置いたまま選択して名前を変更する場合は、[Input] (入力)リストで.idを選択し、[Output] (出力)リストにidentifierと入力します。
    2. 最初の場所のcountryフィールドを選択してスキーマのトップレベルに移動させる場合は、[NEW ELEMENT] (新規エレメント)を追加し、[Input] (入力)リストで.location[0].countryを、[Output] (出力)リストでcountryをそれぞれ選択します。
    3. devicesフィールドを選択して同じ場所に置いておく場合は、[NEW ELEMENT] (新規エレメント)を追加し、[Input] (入力)リストで.devicesを選択して[Output] (出力)リストでdevices_usedと入力します。
    4. otherに等しいサブフィールドnameと共にdevicesフィールドをすべて選択する場合は、[NEW ELEMENT] (新規エレメント)を追加し、[Input] (入力)リストに.devices[*]{.name == "other"}.ipと、[Output] (出力)リストにother_devicesとそれぞれ入力します。

      このエリアではavpath構文を使用できます。

  8. [Save] (保存)をクリックして設定を保存します。

    プロセッサーのプレビューに注目し、再構成前のデータと再構成後のデータを比較します。

  9. [ADD DESTINATION] (デスティネーションの追加)をクリックし、再編成済みのデータを保存するデータセットを選択します。
    必要であれば名前を変更します。
  10. Talend Cloud Pipeline Designerの上部のツールバーで、リストから実行プロファイルを選択します(詳細は実行プロファイルを参照してください)。
  11. 実行アイコンをクリックしてパイプラインを実行します。

タスクの結果

パイプラインは実行中で、データは記述した条件に基づいて再編成され、出力は指定したターゲットシステムに送信されます。