JSONフィールドとXMLフィールドを解析

始める前に

ソースデータを保管するデータセットが追加済みであること。

ここでは、名前や住所などのユーザーデータが含まれるJSONとXMLという両方のフィールドを持つデータセットを使用しています。

unparsed-users.csvファイルをダウンロードします。

これをローカルデータセットとしてインポートし、ファイルの最初の行をヘッダーとして定義できるよう、[Header] (ヘッダー)フィールドを1に設定します。
接続および処理済みデータを保管する関連データセットも作成済みであること。

ここではテストデータセットを使用します。

手順

[Pipelines] (パイプライン)ページで[Add pipeline] (パイプラインを追加)をクリックします。新しいパイプラインが開きます。
パイプラインに意味のある名前を付けます。
例
Parse JSON and XML user fields
[ADD SOURCE] (ソースを追加)をクリックしてパネルを開きます。このパネルで、ソースデータ(この場合はテストデータセットとして手動入力されたJSONおよびXMLユーザーデータの混合)を選択できます。
データセットを選択し、[Select] (選択)をクリックしてパイプラインに追加できるようにします。
必要であれば名前を変更します。
をクリックし、パイプラインにParserプロセッサーを追加します。設定パネルが開きます。
プロセッサーに意味のある名前を付けます。
例
parse JSON fields
[Configuration] (設定)エリアで以下の操作を行います。
1. 入力されたJSONフィールドを最初に解析する場合は、[Format] (形式)リストでJSONを選択します。
2. ユーザーの年齢に対応するJSONフィールドを変換する場合は、[Field to process] (処理するフィールド)リストで.jsonを選択します。
3. [Enforce number as double] (数字を倍数として強制)を有効にすると、入力された数字(年齢など)が倍数データ型に変換されるようになります。
プロセッサーのプレビューに注目し、解析前のデータと解析後のデータを比較します。
をクリックし、パイプラインにParserプロセッサーをもう1つ追加します。設定パネルが開きます。
プロセッサーに意味のある名前を付けます。
例
parse XML fields
[Configuration] (設定)エリアで以下の操作を行います。
1. 入力されたXMLフィールドを最初に解析する場合は、[Format] (形式)リストでXMLを選択します。
2. ユーザーの住所に対応するXMLフィールドを変換する場合は、[Field to process] (処理するフィールド)リストで.xmlを選択します。
[Save] (保存)をクリックして設定を保存します。

プロセッサーのプレビューに注目し、解析前のデータと解析後のデータを比較します。
[ADD DESTINATION] (デスティネーションを追加)をクリックし、出力データを保持するデータセットを選択します。
必要であれば名前を変更します。
Talend Cloud Pipeline Designerの上部ツールバーで[Run] (実行)ボタンをクリックするとパネルが開き、実行プロファイルを選択できるようになります。
リストで実行プロファイルを選択し(詳細は実行プロファイルをご覧ください)、[Run] (実行)をクリックしてパイプラインを実行します。

タスクの結果

パイプラインは実行中となり、入力されたJSONフィールドとXMLフィールドが解析され、JSONオブジェクトとXMLオブジェクトに変換されます。

JSONフィールドとXMLフィールドを解析 - Cloud

Talend Cloud Pipeline Designerプロセッサーガイド

始める前に

手順

例

例

例

タスクの結果