リードに基づいた顧客会社の検索 - Cloud

Talend Cloud Pipeline Designerプロセッサーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
ジョブデザインと開発 > パイプラインのデザイン
Last publication date
2024-02-26

ソース、Field selectorプロセッサー、2つのSplitプロセッサー、デスティネーションを伴うパイプライン。

始める前に

  • ソースデータを保管するデータセットが追加済みであること。

    split-leads.zipファイルをダウンロードして抽出します。顧客リード(ファーストネーム、ラストネーム、メール、住所など)のリストが含まれています。

  • 接続および処理済みデータを保管する関連データセットも作成済みであること。

    ここでは、テスト接続に保存されたファイルを使用します。

手順

  1. [Pipelines] (パイプライン)ページで[Add pipeline] (パイプラインを追加)をクリックします。新しいパイプラインが開きます。
  2. [ADD SOURCE] (ソースを追加)をクリックしてパネルを開きます。このパネルで、ソースデータ(この場合はテストデータセットとして手動で入力された顧客リードのリスト)を選択できます。
  3. データセットを選択し、[Select] (選択)をクリックしてパイプラインに追加できるようにします。
    必要であれば名前を変更します。
  4. +をクリックし、パイプラインにField Selectorプロセッサーを追加します。設定パネルが開きます。
  5. プロセッサーに意味のある名前を付けます。

    select main info
  6. [Selectors] (セレクター)エリアで次の操作を行います。
    1. first_nameフィールドを選択して名前を変更する場合は、[Input] (入力)リストで.first_nameを選択し、[Output] (出力)リストにfirstnameと入力します。
    2. last_nameフィールドを選択して名前を変更する場合は、+記号をクリックして新しいエレメントを追加し、[Input] (入力)リストで.last_nameを選択し、[Output] (出力)リストにlastnameと入力します。
    3. emailフィールドを選択する場合は、+記号をクリックして新しいエレメントを追加し、[Input] (入力)リストで.emailを選択し、[Output] (出力)リストにemailと入力します。
  7. [Save] (保存)をクリックして設定を保存します。
    (オプション)プロセッサーのプレビューに注目し、再構成前のデータと再構成後のデータを比較します。
    顧客レコード再構築後のField selectorプロセッサーのプレビュー。
  8. +をクリックし、パイプラインにSplitプロセッサーを追加します。設定パネルが開きます。
  9. プロセッサーに意味のある名前を付けます。

    split emails
  10. プロセッサーを設定します。
    1. 顧客のメールをローカル部分とドメイン部分に分割する場合は、[Function name] (機能名)リストで[Extract email parts] (メールのエレメントを抽出)を選択します。
    2. [Fields to process] (処理するフィールド)フィールドで.emailを選択します。
    3. [Save] (保存)をクリックして設定を保存します。
  11. +をクリックし、パイプラインにSplitプロセッサーをもう1つ追加します。設定パネルが開きます。
  12. プロセッサーに意味のある名前を付けます。

    validate companies
  13. プロセッサーを設定します。
    1. 会社のセマンティックタイプに基づいて顧客のメールのドメイン部分を検証する場合は、[Function name] (ファンクション名)リストで[Extract values by semantic type] (セマンティックタイプで値を抽出)を選択します。
    2. [Fields to process] (処理するフィールド)フィールドで.email_domainを選択します。
    3. [Semantic type] (セマンティック)リストで[Company] (会社)を選択します。
    4. [Save] (保存)をクリックして設定を保存します。
  14. (オプション) Splitプロセッサーのプレビューに注目し、抽出操作後のデータを確認します。

    メールレコードからメールドメインを抽出した後のSplitプロセッサーのプレビュー。
  15. [ADD DESTINATION] (デスティネーションを追加)をクリックし、再編成済みのデータを保持するデータセットを選択します。
    必要であれば名前を変更します。
  16. Talend Cloud Pipeline Designerの上部ツールバーで[Run] (実行)ボタンをクリックするとパネルが開き、実行プロファイルを選択できるようになります。
  17. リストで実行プロファイルを選択し(詳細は実行プロファイルをご覧ください)、[Run] (実行)をクリックしてパイプラインを実行します。

タスクの結果

パイプラインは実行中となり、リードデータは処理され、顧客会社は会社セマンティックタイプに基づいて検証されて、出力フローは指定したターゲットシステムに送信されます。