入力ファイルのJSONメタデータの設定

Talend Open Studio for Data Integration ユーザーガイド

EnrichVersion
5.6
EnrichProdName
Talend Open Studio for Data Integration
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

このセクションでは、ファイル接続を定義する方法、および入力ファイルのJSONスキーマをアップロードする方法を説明しています。出力JSONファイル接続とスキーマを定義する方法は、出力ファイルのJSONメタデータの設定を参照してください。

一般的なプロパティの定義

  1. ウィザードで、[Name] (名前)、[Purpose] (目的)、[Description] (説明)など、JSONファイルメタデータを識別するための一般的な情報を対応するフィールドに入力します。

    [Name] (名前)フィールドは必須です。また、[Description] (説明)フィールドに入力した情報はファイル接続でマウスオーバーすると、ツールヒントとして表示されます。

    注記

    この手順では、入力接続であるか出力接続であるかを判別しやすくする情報を入力することが推奨されます。どちらであるかは次の手順で定義します。

  2. 必要に応じて、[Version] (バージョン)フィールドと[Status] (ステータス)フィールドを設定します。

    リポジトリアイテムのバージョンとステータスは、[Project Settings] (プロジェクト設定)ダイアログボックスでも管理することができます。詳細は、バージョン管理およびステータス管理を参照してください。

  3. 必要に応じて、[Path] (パス)フィールドのとなりの[Select] (選択)ボタンをクリックし、[File Json] (JSONファイル)ノードの下の作成したファイル接続を格納するフォルダーを選択します。

  4. [Next] (次へ)をクリックして、メタデータのタイプを選択します。

メタデータタイプの設定および入力ファイルのロード

  1. このダイアログボックスでは、[Input Json] (入力JSON)を選択して[Next] (次へ)をクリックし、ウィザードの次の手順に進んで入力ファイルをロードします。

  2. [Browse...] (参照...)をクリックし、アップロードするJSONファイルがあるディレクトリに移動します。または、ファイルへのフルパスもしくはJSONファイルにアクセスするためのURLを入力します。

    [Schema Viewer] (スキーマビューアー)エリアに、JSON構造のプレビューが表示されます。ファイルのJSONツリー構造の各レベルを展開して確認できます。

  3. システムにより自動的に検出されない場合は、[Encoding] (エンコーディング)フィールドにエンコーディングのタイプを入力します。

  4. [Limit] (制限)フィールドに、XPathクエリが実行されるカラムの数を入力します。すべてのカラムに実行する場合は、「0」を入力します。

  5. [Next] (次へ)をクリックして、スキーマのパラメーターを定義します。

スキーマの定義

この手順では、スキーマのパラメーターを設定します。

スキーマの定義ウィンドウは、次の4つのビューで構成されています。

ビュー

説明

Source Schema (ソーススキーマ)

JSONファイルのツリービュー

Target Schema (ターゲットスキーマ)

抽出および繰り返し情報

Preview (プレビュー)

ターゲットスキーマのプレビュー、および選択したカラムの入力データが定義した順番に表示されます。

File Viewer (ファイルビューアー)

JSONファイルのデータのプレビュー

  1. [XPath loop expression] (XPathループ式)フィールドに、繰り返されるノードの絶対XPath式を入力します。これには次の2つの方法があります。

    • 繰り返されるノードの絶対XPath式を入力する(式全体を入力するか、Ctrl+Spaceを押して、オートコンプリートリストを使用する)。

      または

    • [Source schema] (ソーススキーマ)のツリービューから[Xpath loop expression] (Xpathループ式)テーブルの[Absolute XPath expression] (絶対XPath式)フィールドにループモジュールノードをドロップする。

      オレンジ色の矢印が対応する式へのリンクを示します。

    注記

    [Xpath loop expression] (Xpathループ式)の定義は必須です。

  2. [Loop limit] (ループ制限)フィールドで、選択したノードを繰り返す最大数を指定します。

  3. [Source schema] (ソーススキーマ)のツリーから[Fields to extract] (抽出するフィールド)テーブルの[Relative or absolute XPath expression] (相対または絶対XPath表現)フィールドにノードをドロップして、抽出するフィールドを定義します。

    注記

    CtrlキーまたはShiftキーを押したままノードをクリックすると、テーブルにドロップする複数のノードを選択できます。

  4. 必要に応じて、ツールバーを使って、抽出に必要な数のカラムの追加、カラムの削除、カラムの順番の変更ができます。

    • ボタンやボタンを使ってカラムを追加または削除する。

    • ボタンやボタンを使って、カラムの順序を変更する。

  5. ファイルスキーマに、入力ファイルから取得されたものとは異なるカラム名を付けるには、該当する[Column name] (カラム名)フィールドに新しい名前を入力します。

  6. [Refresh Preview] (プレビューの更新)をクリックして、ターゲットスキーマをプレビューします。フィールドを定義した順序でスキーマに表示されます。

  7. [Next] (次へ)をクリックし、スキーマを確定します。

スキーマの確定

ウィザードの最後の手順では、生成されたエンドスキーマが表示され、スキーマを必要に応じてカスタマイズできます。

  1. 必要に応じて、スキーマの名前(デフォルトはmetadata)を変更し、コメントを入力します。

    必要に応じてツールバーを使ってスキーマカラムを追加、削除、移動する、スキーマをXMLファイルにエクスポートする、スキーマ定義XMLファイルをインポートしてスキーマを置き換える、などスキーマをカスタマイズします。

  2. スキーマの基になるJSONファイルが変更されたら、[Guess] (推測)ボタンをクリックして、スキーマを再度生成します。スキーマをカスタマイズしている場合、[Guess](推測)をクリックすると変更が失われることに注意してください。

  3. [Finish] (終了)をクリックします。[Repository] (リポジトリ)ツリービューの該当する[File JSON] (JSONファイル)メタデータの下に新規ファイル接続とそのスキーマが表示されます。

これで、ファイル接続または任意のスキーマを[Repository] (リポジトリ)ツリービューでドラッグして、新しいtFileInputJSONまたはtExtractJSONFieldsコンポーネントとしてデザインワークスペースにドロップするか、既存のコンポーネントにドロップしてメタデータを再利用できます。ジョブで一元化するメタデータの使用方法の詳細は、ジョブで一元化されたメタデータを使用する方法およびリポジトリスキーマを設定する方法を参照してください。

既存のファイル接続を変更するには、[Repository] (リポジトリ)ツリービューで接続を右クリックし、[Edit JSON] (JSONの編集)を選択して、ファイルメタデータセットアップウィザードを開きます。

既存のファイル接続に新規スキーマを追加するには、[Repository] (リポジトリ)ツリービューで接続を右クリックし、コンテキストメニューから[Retrieve Schema] (スキーマ情報の取得)を選択します。

既存のファイルスキーマを編集するには、[Repository] (リポジトリ)ツリービューでスキーマを右クリックし、コンテキストメニューから[Edit Schema] (スキーマの編集)を選択します。