始める前に
-
ソースデータを保管するデータセットが追加済みであること。
ここでは、名前や住所などのユーザーデータが含まれるJSONとXMLという両方のフィールドを持つデータセットを使用しています。
unparsed-users.csvファイルをダウンロードします。
これをローカルデータセットとしてインポートし、ファイルの最初の行をヘッダーとして定義できるよう、[Header] (ヘッダー)フィールドを1に設定します。
-
接続および処理済みデータを保管する関連データセットも作成済みであること。
ここではテストデータセットを使用します。
手順
-
[Pipelines] (パイプライン)ページで[Add pipeline] (パイプラインを追加)をクリックします。新しいパイプラインが開きます。
-
パイプラインに意味のある名前を付けます。
例
Parse JSON and XML user fields
-
[ADD SOURCE] (ソースを追加)をクリックしてパネルを開きます。このパネルで、ソースデータ(この場合はテストデータセットとして手動入力されたJSONおよびXMLユーザーデータの混合)を選択できます。
-
データセットを選択し、[Select] (選択)をクリックしてパイプラインに追加できるようにします。
必要であれば名前を変更します。
-
をクリックし、パイプラインにParserプロセッサーを追加します。設定パネルが開きます。
-
プロセッサーに意味のある名前を付けます。
例
parse JSON fields
-
[Configuration] (設定)エリアで以下の操作を行います。
-
入力されたJSONフィールドを最初に解析する場合は、[Format] (形式)リストでJSONを選択します。
-
ユーザーの年齢に対応するJSONフィールドを変換する場合は、[Field to process] (処理するフィールド)リストで.jsonを選択します。
-
[Enforce number as double] (数字を倍数として強制)を有効にすると、入力された数字(年齢など)が倍数データ型に変換されるようになります。
プロセッサーのプレビューに注目し、解析前のデータと解析後のデータを比較します。
-
をクリックし、パイプラインにParserプロセッサーをもう1つ追加します。設定パネルが開きます。
-
プロセッサーに意味のある名前を付けます。
例
parse XML fields
-
[Configuration] (設定)エリアで以下の操作を行います。
-
入力されたXMLフィールドを最初に解析する場合は、[Format] (形式)リストでXMLを選択します。
-
ユーザーの住所に対応するXMLフィールドを変換する場合は、[Field to process] (処理するフィールド)リストで.xmlを選択します。
-
[Save] (保存)をクリックして設定を保存します。
プロセッサーのプレビューに注目し、解析前のデータと解析後のデータを比較します。
-
[ADD DESTINATION] (デスティネーションを追加)をクリックし、出力データを保持するデータセットを選択します。
必要であれば名前を変更します。
-
Talend Cloud Pipeline Designerの上部ツールバーで[Run] (実行)ボタンをクリックするとパネルが開き、実行プロファイルを選択できるようになります。
-
リストで実行プロファイルを選択し(詳細は実行プロファイルをご覧ください)、[Run] (実行)をクリックしてパイプラインを実行します。
タスクの結果
パイプラインは実行中となり、入力されたJSONフィールドとXMLフィールドが解析され、JSONオブジェクトとXMLオブジェクトに変換されます。