始める前に
-
ソースデータを保管するデータセットが追加済みであること。
ここでは、名前、メール、米国の電話番号などが含まれているデータセットを使用します。データセットとして、このページの左側パネルにある[Downloads] (ダウンロード)タブでsplit-leads.jsonファイルをダウンロードします。
-
接続および処理済みデータを保管する関連データセットも作成済みであること。
ここでは、テスト接続に保存されたファイルを使用します。
手順
-
[Pipelines] (パイプライン)ページで[ADD PIPELINE] (パイプラインの追加)をクリックします。新しいパイプラインが開きます。
-
[ADD SOURCE] (ソースの追加)をクリックし、ソースデータを選択できるパネルを開きます。ここでは、テストデータセットとして手動で入力された顧客リードのリストを使用します。
-
データセットを選択し、[SELECT] (選択)をクリックしてパイプラインに追加します。
必要であれば名前を変更します。
-
をクリックし、パイプラインにField Selectorプロセッサーを追加します。設定パネルが開きます。
-
プロセッサーに意味のある名前を付けます。
例え
select main info
-
[SELECTORS] (セレクター)エリアで以下のようにします:
-
first_nameフィールドを選択して名前を変更する場合は、[Input] (入力)リストに.first_nameと、[Output] (出力)リストにfirstnameとそれぞれ入力します。
-
[NEW ELEMENT] (新規エレメント)を追加し、[Input] (入力)リストに.last_nameと、[Output] (出力)リストにlastnameとそれぞれ入力して、
last_name
フィールドを選択して名前を変更します。
-
email
フィールドを選択する場合は、[NEW ELEMENT] (新規エレメント)を追加し、[Input] (入力)リストに.emailと、[Output] (出力)リストにemailとそれぞれ入力してます。
-
[Save] (保存)をクリックして設定を保存します。
(オプション)プロセッサーのプレビューに注目し、再構成前のデータと再構成後のデータを比較します。
-
をクリックし、パイプラインに[Split] (分割)プロセッサーを追加します。設定パネルが開きます。
-
プロセッサーに意味のある名前を付けます。
例え
split emails
-
プロセッサーを設定します。
-
顧客のメールをローカル部分とドメイン部分に分割する場合は、[Function name] (機能名)リストで[Extract email parts] (メール部分の抽出)を選択します。
-
[Fields to process] (処理するフィールド)フィールドで.emailを選択します。
-
[Save] (保存)をクリックして設定を保存します。
-
をクリックし、パイプラインに[Split] (分割)プロセッサーを追加します。設定パネルが開きます。
-
プロセッサーに意味のある名前を付けます。
例え
validate companies
-
プロセッサーを設定します。
-
会社のセマンティックタイプに基づいて顧客のメールのドメイン部分を検証する場合は、[Function name] (機能名)リストで[Extract values by semantic type] (セマンティックタイプで値を抽出)を選択します。
-
[Fields to process] (処理するフィールド)フィールドで.email_domainを選択します。
-
[Semantic type] (セマンティック)リストで[Company] (会社)を選択します。
-
[Save] (保存)をクリックして設定を保存します。
-
(オプション) [Split] (日付)プロセッサーのプレビューに注目し、抽出操作後のデータを確認します。
例え
-
[ADD DESTINATION] (デスティネーションの追加)をクリックし、再編成済みのデータを保存するデータセットを選択します。
必要であれば名前を変更します。
-
Talend Cloud Pipeline Designerの上部のツールバーで、リストから実行プロファイルを選択します(詳細は実行プロファイルを参照してください)。
-
実行アイコンをクリックしてパイプラインを実行します。
タスクの結果
パイプラインは実行中となり、リードデータは処理され、顧客会社は会社セマンティックタイプに基づいて検証されて、出力フローは指定したターゲットシステムに送信されます。