ユーザーの国コードと実際の国名の組み合わせ - Cloud

Talend Cloud Pipeline Designerプロセッサーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発 > パイプラインのデザイン
EnrichPlatform
Talend Pipeline Designer

始める前に

  • ソースデータを保管するシステムへの接続が作成済みであること。

    ここではテスト接続を例に取ります。

  • ソースデータを保管するデータセットが追加済みであること。

    ここでは、左データセットに国コードとインデックスを含むユーザーデータが保存され、右データセットにソースデータと組み合わせるデータ(国名とインデックス)が保存されています: 国名とインデックス(このページの左側のパネルの[Downloads] (ダウンロード)タブからjoin-countries.jsonjoin-users.jsonファイルをダウンロードしてください)。

  • 接続および処理済みデータを保管する関連データセットも作成済みであること。

    ここではテスト接続を例に取ります。

手順

  1. [Pipelines] (パイプライン)ページで[ADD PIPELINE] (パイプラインの追加)をクリックします。新しいパイプラインが開きます。
  2. パイプラインに意味のある名前を付けます。

    例え

    Join Country Data
  3. [ADD SOURCE] (ソースの追加)をクリックして、ソースデータを選択できるパネルを開きます。ここでは、HDFSに保存されている顧客と国コードのリストです。

    例え

  4. データセットを選択し、[SELECT] (選択)をクリックしてパイプラインに追加します。
    必要であれば名前を変更します。
  5. をクリックして、パイプラインに[Join] (結合)プロセッサーを追加します。[Configuration] (運用設定)パネルが開きます。
  6. プロセッサーに意味のある名前を付けます。

    例え

    国データを結合
  7. [CONFIGURATION] (運用設定)エリアで以下のようにします:
    1. [Join dataset] (結合データセット)リストで、ソースデータセットと組み合わせるデータセットを選択します(ここでは、Countriesというデータセット)。
    2. 左データセットからの一致レコードと追加レコードを結果セットに表示する場合は、[Join type] (結合タイプ)リストで[Left outer join] (左外部結合)を選択します。
  8. [CONDITIONS] (条件)エリアで以下のようにします:
    1. 左データセット内の比較する既存のレコードへのパスを選択するか、または[Left key] (左キー)リストに入力します(ここでは.countryCode)。
    2. 右データセット内の比較する既存のレコードへのパスを選択するか、または[Right key] (右キー)リストに入力します(ここでは.index)。

      このエリアではavpath構文を使用できます。

  9. [Save] (保存)をクリックして設定を保存します。

    プロセッサーのプレビューを表示し、結合前のデータと結合後のデータを比較します。

    注: [Join] (結合)プロセッサー設定を保存すると、[JOIN DATASET] (データセットの結像)タブが[Data preview] (データのプレビュー)エリアに表示され、結合オペレーションの結果をプレビューできます。
  10. [Join] (結合)プロセッサーの横にある[ADD DESTINATION] (デスティネーションの追加)アイテムをクリックして、結合されたデータを保存するデータセットを選択します。
    必要であれば名前を変更します。
  11. Talend Cloud Pipeline Designerの上部のツールバーで、リストから実行プロファイルを選択します(詳細は実行プロファイルを参照してください)。
  12. 実行アイコンをクリックしてパイプラインを実行します。

タスクの結果

パイプラインは実行中で、ユーザーの国データは結合され、国コードと国の完全な名前の両方が、指定のターゲットシステムに送信される生成された出力内で組み合わされています。