手順 - Cloud - 8.0

XML

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > XMLコンポーネント
データガバナンス > サードパーティーシステム > XMLコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > XMLコンポーネント
Last publication date
2024-02-28

手順

  1. [Palette] (パレット)から、tFileInputDelimitedtExtractXMLFieldtFileOutputDelimited および tLogRowのコンポーネントをデザインワークスペースにドロップします。
    [Row Main] (行メイン)リンクを使って、最初の3つのコンポーネントを接続します。
    [Row Reject] (行リジェクト)リンクを使用してtExtractXMLFieldtLogRowに接続します。
  2. tFileInputDelimitedをダブルクリックして、その[Basic settings] (基本設定)ビューを開き、コンポーネントのプロパティを定義します。
  3. [Schema] (スキーマ)リストで[Built-in] (組み込み)を選択し、対応するフィールドにファイルメタデータを手動で入力します。
    [Edit Schema] (スキーマを編集)の横にある[...]ボタンをクリックすると、データのストラクチャーを定義できるダイアログボックスが表示されます。
    プラスボタンをクリックして、データストラクチャーに必要な数のカラムを追加します。このサンプルでは、xmlStrというスキーマに1つのカラムがあります。
    [OK]をクリックして変更を確定し、ダイアログボックスを閉じます。
    注:

    [File delimited] (区切り付きファイル)の下の[Metadata] (メタデータ)フォルダーにスキーマを保存している場合は、[Schema] (スキーマ)リストから[Repository] (リポジトリー)を選択し、フィールドの横にある[...]ボタンをクリックすると、リストから関連するスキーマを選択できる[Repository Content] (リポジトリーコンテンツ)ダイアログボックスが表示されます。[OK]をクリックしてダイアログボックスを閉じ、フィールドにスキーマメタデータを自動的に入力します。 

    [Repository] (リポジトリー)ツリービューにスキーマメタデータを保管する方法については、Talend Studioでメタデータを管理をご覧ください。

  4. [File Name] (ファイル名)フィールドで[...]ボタンをクリックし、処理する入力区切り付きファイル(このサンプルではCustomerDetails_Error)を参照します。
    この区切り付きファイルには、二重改行で区切られた多数の単純XML行が含まれています。
    入力ファイルで使用されている行区切りおよびフィールド区切りを対応するフィールドに設定しますが、このサンプルでは前者には二重改行を使用し、後者には何も設定しません。
    必要に応じて、[Header] (ヘッダー)[Footer] (フッター)、および[Limit] (制限)を設定するために使われます。このサンプルでは使用していません。
  5. デザインワークスペースでtExtractXMLFieldをダブルクリックして[Basic settings] (基本設定)ビューを表示し、コンポーネントプロパティを定義します。
  6. [Sync columns] (カラムを同期)をクリックすると、先行コンポーネントからスキーマが取得されます。[Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして、スキーマを表示や変更できます。
    [Mapping] (マッピング)テーブルの[Column] (カラム)フィールドには、定義されたスキーマが自動的に入力されます。
  7. [Xml field] (XMLフィールド)リストで、XMLデータを抽出するカラムを選択します。このサンプルでは、XMLデータを保持するフィールドはxmlStrと呼ばれています。
    [Loop XPath query] (ループXPathクエリー)フィールドに、ループしてデータを取得するXMLツリーのノードを入力します。
  8. デザインワークスペースでtFileOutputDelimitedをダブルクリックして[Basic settings] (基本設定)ビューを開き、コンポーネントプロパティを表示します。
  9. [File Name] (ファイル名)フィールドで、このサンプルではCustomerNames_right.csvに正しいデータを書き込む出力ファイルを定義するか参照します。
    [Sync columns] (カラムを同期)をクリックして、先行コンポーネントからスキーマを取得します。[Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして、スキーマを表示や変更できます。
  10. デザインワークスペースでtLogRowをダブルクリックして[Basic settings] (基本設定)ビューを表示し、コンポーネントプロパティを定義します。
    [Sync columns] (カラムを同期)をクリックして、先行コンポーネントからスキーマを取得します。このコンポーネントの詳細は、tLogRowをご覧ください。
  11. ジョブを保存し、F6を押して実行します。

タスクの結果

tExtractXMLFieldによりクライアント情報のXMLストラクチャーが正しく読み取られ抽出されたものは区切り付きファイル[CustomerNames_right]に出力され、エラーの発生したデータは[Run] (実行)ビューのコンソールに表示されます。