登録日と収入に基づいた顧客リストのフィルタリング - Cloud

Talend Cloud Pipeline Designerプロセッサーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発 > パイプラインのデザイン
EnrichPlatform
Talend Pipeline Designer

始める前に

  • ソースデータを保管するシステムへの接続が作成済みであること。

    これが、データベースへの接続です。

  • ソースデータを保管するデータセットが追加済みであること。

    これが、このドキュメントに添付できる登録日フィールドがある顧客のリストです。このページの左側パネルにある[Downloads] (ダウンロード)タブでfilter-python-customers.jsonファイルをダウンロードします。

  • 接続および処理済みデータを保管する関連データセットも作成済みであること。

    ここでは、ファイルはHDFSに保管されています。

手順

  1. [Pipelines] (パイプライン)ページで[ADD PIPELINE] (パイプラインの追加)をクリックします。新しいパイプラインが開きます。
  2. パイプラインに意味のある名前を付けます。

    例え

    Filter on Registration and Revenue
  3. [ADD SOURCE] (ソースの追加)をクリックして、ソースデータを選択できるパネルを開きます。ここでは、データベースに保存されている顧客のリストです。

    例え

  4. データセットを選択し、[SELECT] (選択)をクリックしてパイプラインに追加します。
    必要であれば名前を変更します。
  5. をクリックして、パイプラインに[Filter] (フィルター)プロセッサーを追加します。[Configuration] (運用設定)パネルが開きます。
  6. プロセッサーに意味のある名前を付けます。

    例え

    customers registered in 2000
  7. [Filter] (フィルター)エリアで以下のようにします:
    1. [Input] (入力)リストで.RegistrationDateを選択し、この値に基づいて顧客をフィルタリングします。
    2. レコードのフィルタリングで関数を適用しない場合は、[Optionally select a function to apply] (適用する機能をオプションとして選択)リストで[NONE] (なし)を選択します。
    3. 登録日に2000年が含まれている顧客をフィルタリングする場合は、[Operator] (オペレーター)リストでCONTAINSを選択し、[Value] (値)リストに2000と入力します。

      このエリアではavpath構文を使用できます。

  8. [Save] (保存)をクリックして設定を保存します。
  9. をクリックして、パイプラインに別の[Filter] (フィルター)プロセッサーを追加します。[Configuration] (運用設定)パネルが開きます。
  10. プロセッサーに意味のある名前を付けます。

    例え

    customers with revenue > 90000
  11. [Filter] (フィルター)エリアで以下のようにします:
    1. [Input] (入力)リストで.Revenueを選択し、この値に基づいて顧客をフィルタリングします。
    2. レコードのフィルタリングで関数を適用しない場合は、[Optionally select a function to apply] (適用する機能をオプションとして選択)リストで[NONE] (なし)を選択します。
    3. 90000ドルを超える収入のある顧客をフィルタリングする場合は、[Operator] (オペレーター)リストで>を選択し、[Value] (値)リストに90000と入力します。
  12. [Save] (保存)をクリックして設定を保存します。
  13. 最初の[Filter] (フィルター)プロセッサーの横にあるボタンをクリックし、フィルター基準に一致しないデータを保存するデータセットを追加および選択します。
  14. デスティネーションに意味のある名前を付けます。

    例え

    other registration date
  15. [Filter] (フィルター)プロセッサーの横にある[ADD DESTINATION] (デスティネーションの追加)ボタンをクリックし、フィルター基準に一致しないデータを保存するデータセットを追加および選択します。
    必要であれば名前を変更します。
  16. 2番目の[Filter] (フィルター)プロセッサーの横にあるボタンをクリックして、リジェクトデータを保存するデータセットを選択します。
  17. デスティネーションに意味のある名前を付けます。

    例え

    other customers
  18. (オプション) 最後の[Filter] (フィルター)プロセッサープレビューを表示し、フィルタリングオペレーション後のデータを確認します。
  19. Talend Cloud Pipeline Designerの上部のツールバーで、リストから実行プロファイルを選択します(詳細は実行プロファイルを参照してください)。
  20. 実行アイコンをクリックしてパイプラインを実行します。

タスクの結果

パイプラインが実行されると、記述した条件に基づいてデータがフィルタリングされ、指定したターゲットシステムに出力が送られます。