JSONフィールドとXMLフィールドを解析 - Cloud

Talend Cloud Pipeline Designerプロセッサーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
ジョブデザインと開発 > パイプラインのデザイン
Last publication date
2024-02-26

ソース、2つのParserプロセッサー、デスティネーションを伴うパイプライン。

始める前に

  • ソースデータを保管するデータセットが追加済みであること。

    ここでは、名前や住所などのユーザーデータが含まれるJSONとXMLという両方のフィールドを持つデータセットを使用しています。

    unparsed-users.csvファイルをダウンロードします。

    これをローカルデータセットとしてインポートし、ファイルの最初の行をヘッダーとして定義できるよう、[Header] (ヘッダー)フィールドを1に設定します。

  • 接続および処理済みデータを保管する関連データセットも作成済みであること。

    ここではテストデータセットを使用します。

手順

  1. [Pipelines] (パイプライン)ページで[Add pipeline] (パイプラインを追加)をクリックします。新しいパイプラインが開きます。
  2. パイプラインに意味のある名前を付けます。

    Parse JSON and XML user fields
  3. [ADD SOURCE] (ソースを追加)をクリックしてパネルを開きます。このパネルで、ソースデータ(この場合はテストデータセットとして手動入力されたJSONおよびXMLユーザーデータの混合)を選択できます。
    未解析のユーザーレコードを持つデータサンプルのプレビュー。
  4. データセットを選択し、[Select] (選択)をクリックしてパイプラインに追加できるようにします。
    必要であれば名前を変更します。
  5. +をクリックし、パイプラインにParserプロセッサーを追加します。設定パネルが開きます。
  6. プロセッサーに意味のある名前を付けます。

    parse JSON fields
  7. [Configuration] (設定)エリアで以下の操作を行います。
    1. 入力されたJSONフィールドを最初に解析する場合は、[Format] (形式)リストでJSONを選択します。
    2. ユーザーの年齢に対応するJSONフィールドを変換する場合は、[Field to process] (処理するフィールド)リストで.jsonを選択します。
    3. [Enforce number as double] (数字を倍数として強制)を有効にすると、入力された数字(年齢など)が倍数データ型に変換されるようになります。

    プロセッサーのプレビューに注目し、解析前のデータと解析後のデータを比較します。

    ユーザーの年齢に関するJSONレコードを解析した後のParserプロセッサーのプレビュー。
  8. +をクリックし、パイプラインにParserプロセッサーをもう1つ追加します。設定パネルが開きます。
  9. プロセッサーに意味のある名前を付けます。

    parse XML fields
  10. [Configuration] (設定)エリアで以下の操作を行います。
    1. 入力されたXMLフィールドを最初に解析する場合は、[Format] (形式)リストでXMLを選択します。
    2. ユーザーの住所に対応するXMLフィールドを変換する場合は、[Field to process] (処理するフィールド)リストで.xmlを選択します。
  11. [Save] (保存)をクリックして設定を保存します。

    プロセッサーのプレビューに注目し、解析前のデータと解析後のデータを比較します。

    ユーザーアドレスに関するXMLレコードを解析した後のParserプロセッサーのプレビュー。
  12. [ADD DESTINATION] (デスティネーションを追加)をクリックし、出力データを保持するデータセットを選択します。
    必要であれば名前を変更します。
  13. Talend Cloud Pipeline Designerの上部ツールバーで[Run] (実行)ボタンをクリックするとパネルが開き、実行プロファイルを選択できるようになります。
  14. リストで実行プロファイルを選択し(詳細は実行プロファイルをご覧ください)、[Run] (実行)をクリックしてパイプラインを実行します。

タスクの結果

パイプラインは実行中となり、入力されたJSONフィールドとXMLフィールドが解析され、JSONオブジェクトとXMLオブジェクトに変換されます。