入力ファイルのXMLメタデータの設定

Talend Open Studio for Data Integration ユーザーガイド

EnrichVersion
5.6
EnrichProdName
Talend Open Studio for Data Integration
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

このセクションでは、ファイル接続を定義する方法、および入力ファイルのXMLスキーマをアップロードする方法を説明しています。出力ファイルの定義とアップロードを行うには、出力ファイルのXMLメタデータの設定を参照してください。

一般的なプロパティの定義

この手順では、名前目的説明など、メタデータの一般的なプロパティを設定します。

  1. ファイルメタデータセットアップウィザードで、[Name] (名前)フィールド(必須)、[Purpose] (目的)フィールドと[Description] (説明)フィールド(任意)を入力します。[Description] (説明)フィールドに入力した情報は、ファイル接続にマウスのポインターを移動すると、ツールヒントとして表示されます。

    注記

    作成するメタデータの一般的なプロパティを入力する際に、接続のタイプを入力または出力のいずれかに定義する必要があります。そのため、入力スキーマであるか出力スキーマであるかを判別しやすくする情報を入力することが推奨されます。

  2. 必要に応じて、[Version] (バージョン)フィールドと[Status] (ステータス)フィールドを設定します。リポジトリアイテムのバージョンとステータスは、[Project Settings] (プロジェクト設定)ダイアログボックスでも管理できます。詳細は、バージョン管理およびステータス管理を参照してください。

  3. 必要に応じて、[Path] (パス)フィールドの横の[Select] (選択)ボタンをクリックし、[File XML] (XMLファイル)ノードの下で、作成したばかりのファイル接続を格納するフォルダーを選択します。既存の接続を編集している場合、フォルダーを選択することはできませんが、いつでも接続をドラッグして新規フォルダーにドロップできます。

  4. [Next] (次へ)をクリックして、メタデータのタイプを選択します。

メタデータのタイプ(入力)の設定

この手順は、メタデータのタイプを入力または出力にいずれかに設定する方法です。ここでの手順では、入力に設定する方法を説明しています。

  1. ダイアログボックスで、Input XML (入力XML)を選択します。

  2. [Next] (次へ)をクリックして、入力ファイルをアップロードします。

XMLファイルのアップロード

この手順は、XMLファイルをアップロードして、XMLツリー構造を取得する方法を説明しています。XMLスキーマ定義(XSD)ファイルをアップロードするには、XSDファイルのアップロードを参照してください。

この手順を説明するために使用される入力XMLファイルの例には、連絡先情報と次のような構造が含まれます。

<contactInfo>
  <contact>
    <id>1</id>
    <firstName>Michael</firstName>
    <lastName>Jackson</lastName>
    <company>Talend</company>
    <city>Paris</city>
    <phone>2323</phone>
  </contact>
  <contact>
    <id>2</id>
    <firstName>Elisa</firstName>
    <lastName>Black</lastName>
    <company>Talend</company>
    <city>Paris</city>
    <phone>4499</phone>
  </contact>
  ...
</contactInfo>

XMLファイルをアップロードするには、次の手順を実行します。

  1. [Browse...] (参照...)をクリックし、アップロードするXMLファイルがあるディレクトリに移動します。または、ファイルにアクセスするためのパスを入力します。

    [Schema Viewer] (スキーマビューアー)エリアに、XML構造のプレビューが表示されます。ファイルのXMLツリー構造の各レベルを展開して確認できます。

  2. システムにより自動的に検出されない場合は、[Encoding] (エンコーディング)フィールドにエンコーディングのタイプを入力します。

  3. [Limit] (制限)フィールドに、XPathクエリが実行されるカラムの数を入力します。すべてのカラムに実行する場合は、「0」を入力します。

  4. [Next] (次へ)をクリックして、スキーマのパラメーターを定義します。

XSDファイルのアップロード

この手順は、XSDファイルをアップロードして、XMLツリー構造を取得する方法を説明しています。XMLファイルをアップロードするには、XMLファイルのアップロードを参照してください。

XSDファイルはXMLファイルのスキーマを定義するために使用します。前述の例でのXMLファイルの構造とモジュールのデータ型は、次のXSDを使って説明できます。これはこのセクションのXSD入力例として使用します。

<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified">
  <xs:element name="contactInfo">
    <xs:complexType>
      <xs:sequence>
        <xs:element maxOccurs="unbounded" ref="contact"/>
      </xs:sequence>
    </xs:complexType>
  </xs:element>
  <xs:element name="contact">
    <xs:complexType>
      <xs:sequence>
        <xs:element ref="id"/>
        <xs:element ref="firstName"/>
        <xs:element ref="lastName"/>
        <xs:element ref="company"/>
        <xs:element ref="city"/>
        <xs:element ref="phone"/>
      </xs:sequence>
    </xs:complexType>
  </xs:element>
  <xs:element name="id" type="xs:integer"/>
  <xs:element name="firstName" type="xs:NCName"/>
  <xs:element name="lastName" type="xs:NCName"/>
  <xs:element name="company" type="xs:NCName"/>
  <xs:element name="city" type="xs:NCName"/>
  <xs:element name="phone" type="xs:integer"/>
</xs:schema>

XMLスキーマの詳細は、http://www.w3.org/XML/Schemaを参照してください。

注記

XSDファイルをロードする場合

  • データはリポジトリに保存されるため、ファイルを削除しても移動しても、メタデータには影響がありません。

  • モジュールをXMLツリーのルートとして選択できます。

XSDファイルをアップロードするには、次の手順を実行します。

  1. [Browse...] (参照...)をクリックし、アップロードするXSDファイルがあるディレクトリに移動します。または、ファイルにアクセスするためのパスを入力します。

  2. 表示されるダイアログボックスの[Root] (ルート)リストで、XMLツリーのルートにするモジュールを選択し、[OK]をクリックします。

    [Schema Viewer] (スキーマビューアー)エリアに、XML構造のプレビューが表示されます。ファイルのXMLツリー構造の各レベルを展開して確認できます。

  3. システムにより自動的に検出されない場合は、[Encoding] (エンコーディング)フィールドにエンコーディングのタイプを入力します。

  4. [Limit] (制限)フィールドに、XPathクエリが実行されるカラムの数を入力します。すべてのカラムに実行する場合は、「0」を入力します。

  5. [Next] (次へ)をクリックして、スキーマのパラメーターを定義します。

スキーマの定義

この手順では、スキーマのパラメーターを設定します。

スキーマの定義ウィンドウは、次の4つのビューで構成されています。

ビュー

説明

Source Schema (ソーススキーマ)

XMLファイルのツリービュー

Target Schema (ターゲットスキーマ)

抽出および繰り返し情報

Preview (プレビュー)

ターゲットスキーマのプレビュー、および選択したカラムの入力データが定義した順番に表示されます。

注記

XSDファイルをロードした場合は、プレビュー機能は利用できません。

File Viewer (ファイルビューアー)

生データのプレビュー

最初にXpathループとそのループが実行される最大数を定義します。そのためには、次の手順を実行します。

  1. [XPath loop expression] (XPathループ式)フィールドに、繰り返されるノードの絶対XPath式を入力します。これには次の2つの方法があります。

    • 繰り返されるノードの絶対XPath式を入力する(式全体を入力するか、Ctrl+Spaceを押して、オートコンプリートリストを使用する)。

      または

    • [Source schema] (ソーススキーマ)のツリービューから[Absolute XPath expression] (絶対XPath式)にノードをドロップする。

      オレンジ色の矢印が対応する式へのリンクを示します。

    注記

    [Xpath loop expression] (Xpathループ式)フィールドは必須です。

  2. [Loop limit] (ループ制限)フィールドで、選択したノードを繰り返す最大数を指定します。

  3. [Source schema] (ソーススキーマ)のツリービューから[Relative or absolute XPath expression] (相対または絶対XPath表現)フィールドにノードをドロップして、抽出するフィールドを定義します。

    注記

    CtrlキーまたはShiftキーを押したままノードをクリックすると、テーブルにドロップする複数のノードを選択できます。[Source schema] (ソーススキーマ)のツリービューで選択した個々のノードと[Fields to extract] (抽出するフィールド)テーブルのリンクが青色の矢印で示されます。その他はグレーで示されます。

  4. 必要に応じて、ツールバーを使って、抽出に必要な数のカラムの追加、カラムの削除、カラムの順番の変更ができます。

    • ボタンやボタンを使ってカラムを追加または削除する。

    • ボタンやボタンを使って、カラムの順序を変更する。

  5. [Column name] (カラム名)フィールドに、スキーマの[Preview] (プレビュー)エリアに表示されるカラムのラベルを入力します。

  6. [Refresh Preview] (プレビューの更新)をクリックして、ターゲットスキーマのプレビューを表示します。フィールドが定義された順番でスキーマに表示されます。

    注記

    XSDファイルをロードした場合は、プレビュー機能は利用できません。

  7. [Next] (次へ)をクリックして、エンドスキーマの確認と編集を行います。

エンドスキーマの完了

生成されたスキーマにはXMLファイルで選択したカラムが表示され、スキーマをさらに定義できます。

  1. 必要に応じて、[Name] (名前)フィールドでメタデータの名前(デフォルトはmetadata)を変更し、[Comment] (コメント)を追加し、さらに次のような変更ができます。

    • 該当するフィールドを編集して、カラムを再定義する。

    • ボタンやボタンを使ってカラムを追加または削除する。

    • ボタンやボタンを使って、カラムの順序を変更する。

  2. スキーマの基になるXMLファイルが変更されたら、[Guess] (推測)ボタンをクリックして、スキーマを再度生成します。スキーマをカスタマイズしている場合、[Guess](推測)をクリックすると変更が失われることに注意してください。

  3. [Finish] (終了)をクリックします。新しいファイル接続とそのスキーマが、[Repository] (リポジトリ)ツリービューの[File XML] (XMLファイル)ノードの下に表示されます。

これで、ファイル接続またはそのスキーマを[Repository] (リポジトリ)ツリービューでドラッグして、新規のtFileInputXMLコンポーネントまたはtExtractXMLFieldコンポーネントとしてデザインワークスペースにドロップするか、既存のコンポーネントにドロップしてメタデータを再利用できるようになりました。ジョブで一元管理されるメタデータの使用方法についての詳細は、ジョブで一元化されたメタデータを使用する方法およびリポジトリスキーマを設定する方法を参照してください。

既存のファイル接続を変更するには、[Repository] (リポジトリ)ツリービューで接続を右クリックし、[Edit file xml] (XMLファイルの編集)を選択して、ファイルメタデータセットアップウィザードを開きます。

既存のファイル接続に新規スキーマを追加するには、[Repository] (リポジトリ)ツリービューで接続を右クリックし、コンテキストメニューから[Retrieve Schema] (スキーマ情報の取得)を選択します。

既存のファイルスキーマを編集するには、[Repository] (リポジトリ)ツリービューでスキーマを右クリックし、コンテキストメニューから[Edit Schema] (スキーマの編集)を選択します。