クエリーを使ってユーザーデバイスのリストを処理 - Cloud

Talend Cloud Pipeline Designerプロセッサーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
ジョブデザインと開発 > パイプラインのデザイン
Last publication date
2024-02-26

ソース、Data Shaping Languageプロセッサー、Filterプロセッサー、デスティネーションを伴うパイプライン。

始める前に

  • ソースデータを保管するシステムへの接続が作成済みであること。

    ここでは、テスト接続を使用します。

  • ソースデータを保管するデータセットが追加済みであること。

    query_language-devices.zipファイルをダウンロードして抽出します。ユーザーのデバイスに関する調査(デバイスの種類、購入日、IPアドレスなど)を持つ.json階層ファイルが含まれています。

  • 接続および処理済みデータを保管する関連データセットも作成済みであること。

    ここでは、S3バケット上に保管されたファイルを使用します。

手順

  1. [Pipelines] (パイプライン)ページで[Add pipeline] (パイプラインを追加)をクリックします。新しいパイプラインが開きます。
  2. パイプラインに意味のある名前を付けます。

    Query and process a list of user devices
  3. [ADD SOURCE] (ソースを追加)をクリックしてパネルを開きます。このパネルで、ソースデータ(この場合はユーザーデバイスに関する階層データの調査)を選択できます。

    ユーザーデバイスに関するデータサンプルのプレビュー。
  4. データセットを選択し、[Select] (選択)をクリックしてパイプラインに追加できるようにします。
    必要であれば名前を変更します。
  5. +をクリックし、パイプラインにData Shaping Languageプロセッサーを追加します。[Configuration] (設定)パネルが開きます。
  6. プロセッサーに意味のある名前を付けます。

    query recent devices
  7. [Data Shaping Language]エリアに、次のコードを入力します:
    FROM devices AS dv
    WHERE toDate(dv.purchase_date) > toDate("2015-01-01")
    SELECT {
    device_type = name,
    purchase_date = dv.purchase_date,
    ip_address = ip }
    このコードによって以下の処理が可能になります。
    • dvdevicesレコードのエイリアスとして定義できます

    • 2015年1月1日以降の日付に購入されたデバイスをフィルタリングできます

    • 一部のレコードの名前を変更し、フラット化できます(namedevice_typeに、 ipip_addressになります)

    クエリー言語構文の詳細は、Talend Data Shaping Languageリファレンスガイドをご覧ください。

  8. [Save] (保存)をクリックして設定を保存します。

    プレビューでは、新しいストラクチャーを確認できます。ストラクチャーがフラット化されたため、出力されるレコードが増加して、2015年1月1日以降に購入されたデバイスのみ表示されます。

    クエリーでデバイスレコードを処理した後のData Shaping Languageプロセッサーのプレビュー。
  9. +をクリックし、パイプラインにFilterプロセッサーを追加します。[Configuration] (設定)パネルが開きます。
  10. プロセッサーに意味のある名前を付けます。

    keep records about phones
  11. Filterエリアで次の操作を行います。
    1. この値に基づいて顧客をフィルタリングしたいので、[Input] (入力)リストで[.device_type]を選択します。
    2. レコードのフィルタリング時にファンクションを適用したくないので、[Optionally select a function to apply] (適用するファンクションをオプションとして選択)リストで[None] (なし)を選択します。
    3. 電話を持つユーザーをフィルタリングしたいので、[Operator] (オペレーター)リストで==を選択し、[Value] (値)リスト内にphoneと入力します。
    4. [Save] (保存)をクリックして設定を保存します。プレビューでは、フィルタリング条件(電話を持つユーザー)と一致するレコードを確認できます。
      電話情報が含まれているレコードを保持するフィルターを適用した後のフィルタープロセッサーのプレビュー。
  12. パイプラインで[ADD DESTINATION] (デスティネーションを追加)をクリックしてパネルを開くと、処理済みデータを保持するデータセットを選択できます。
    必要であれば名前を変更します。
  13. Talend Cloud Pipeline Designerの上部ツールバーで[Run] (実行)ボタンをクリックするとパネルが開き、実行プロファイルを選択できるようになります。
  14. リストで実行プロファイルを選択し(詳細は実行プロファイルをご覧ください)、[Run] (実行)をクリックしてパイプラインを実行します。

タスクの結果

パイプラインは実行中となり、クエリー言語を使って記述した条件に基づいてデータが処理され、指定したターゲットシステムに出力されます。