tFileInputXML の標準プロパティ - 7.3

XML connectors

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > XMLコンポーネント > XMLコネクター
データガバナンス > サードパーティーシステム > XMLコンポーネント > XMLコネクター
データクオリティとプレパレーション > サードパーティーシステム > XMLコンポーネント > XMLコネクター
Last publication date
2024-02-22

これらのプロパティは、標準ジョブのフレームワークで実行されているtFileInputXMLを設定するために使われます。

標準tFileInputXMLコンポーネントは、ファイルファミリーとXMLファミリーに属しています。

このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。

基本設定

[Property type] (プロパティタイプ)

[Built-in] (組み込み)[Repository] (リポジトリー)のいずれかです。

 

[Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。

 

[Repository] (リポジトリー): プロパティが保存されているリポジトリーファイルを選択します。

[Schema] (スキーマ)および[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマを表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

 

[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

ファイル名/ストリーム

[File Name] (ファイル名): 処理されるファイルの名前とパス

警告: エラーを避けるために、このフィールドには(相対パスの代わりに)絶対パスを使用します。

[Stream] (ストリーミング): 処理されるデータフロー。tFileInputXMLが対応する代表変数を介してこれらのデータを取得するには、データをフローに追加する必要があります。

この変数はStudioで事前に定義されているか、このコンポーネントで使用されているコンテキストまたはコンポーネントによって提供されている可能性があります。たとえば、tFileFetchINPUT_STREAM変数です。提供されていない場合、tJavaまたはtJavaFlexを使用して、手入力で変数を定義し、ジョブデザインに基づいて使用できます。

手入力の手間を省くため、変数が適切に定義されることを確認する必要があるものの、予測変換リスト([Ctrl] + [Space])から目的の変数を選択して、現在のフィールドに入力できます。

使用可能な変数に関連するトピックは、 Talend Studioユーザーガイドをご覧ください。入力ストリームに関連するシナリオであるストリーミングモードでのリモートファイルからのデータの読み取りをご覧ください。

ループXPathクエリー

ループが基礎となっているツリーのノード。

[Mapping] (マッピング)

[Column] (カラム): マップするカラム。スキーマタイプフィールドで定義されているスキーマを反映します。

[XPath Query] (XPathクエリー): ストラクチャー化入力から抽出する項目を入力します。

[Get Nodes] (ノードを取得): このチェックボックスをオンにすると、[Xpath query] (Xpathクエリー)リストで指定されたすべての現在のノードのXMLコンテンツが回復します。また、特定のXMLノードの横にあるチェックボックスをオンにすると、選択したノードのコンテンツのみが回復します。これらのノードは、このコンポーネントからの出力フローがXML構造(たとえばドキュメントデータ型)を使用する必要がある時に重要です。

ドキュメント型の詳細は、 Talend Studioユーザーガイドをご覧ください。

注:

SAXモードのネームスペースはサポートされていませんが、[Get Nodes] (ノードを取得)オプションはDOM4jおよびSAXモードで機能します。DOM4jモードとSAXモードの詳細は、[Advanced settings] (詳細設定)タブの[Generation mode] (生成モード)リストに記載されているプロパティをご覧ください。

[Limit] (制限)

処理される行の最大数。[Limit] (制限) = 0の場合、行の読み取りや処理は行われません。-1の場合、すべての行が読み取られるか処理されます。

[Die on error] (エラー発生時に強制終了)

このチェックボックスをオンにすると、エラー発生時にジョブの実行が停止されます。

エラーの発生した行をスキップし、エラーが発生していない行の処理を完了するには、このチェックボックスをオフにします。エラーをスキップしたら、[Row] (行)> [Reject] (リジェクト)リンクを使用してエラーの発生した行を収集できます。

詳細設定

DTDファイルを無視

処理中のXMLファイルに示されているDTDファイルを無視するには、このチェックボックスをオンにします。

[Advanced separator (for number)] (高度な区切り文字:数値)

数値に使用する区切りを変更する場合は、このチェックボックスをオンにします。デフォルトでは、桁区切りはコンマ(,)で、小数点区切りはピリオド(.)です。

数千の区切り文字: 数千もの区切りを定義します。

小数点の区切り文字: 小数点の区切りを定義します。

[Ignore the namespaces] (ネームスペースを無視)

ネームスペースを無視するには、このチェックボックスをオンにします。

[Generate a temporary file] (一時ファイルを生成): [...]ボタンをクリックしてXML一時ファイルを参照し、フィールドにパスを設定するために使われます。

[Use Separator for mode Xerces] (モードXercesに区切りを使用)

連結された子ノード値を区切る場合は、このチェックボックスをオンにします。

注:

このフィールドは、選択した[Generation mode] (生成モード)がXercesの場合にのみ使用できます。

次のフィールドが表示されます。

[Field separator] (フィールド区切り):子ノード値を区切るために使用される区切りを定義します。

[Encoding] (エンコーディング)

リストからエンコーディングを選択するか、[CUSTOM] (カスタム)を選択して、手動で定義します。このフィールドはデータベースデータ処理の必須フィールドです。サポートされるエンコーディングは、使用しているJVMに応じて異なります。詳細は、https://docs.oracle.comをご覧ください。

Generation mode (生成モード)

利用可能なメモリと必要な速度に従って、ドロップダウンリストからXMLファイルの生成モードを選択します。

  • Slow and memory-consuming (Dom4j) (低速およびメモリ消費多)

    注:

    このオプションでは、dom4jを使用して、複雑なXMLファイルを処理できます。

  • [Memory-consuming (Xerces)] (メモリ消費量(Xerces))

  • [Fast with low memory consumption (SAX)] (高速でメモリ消費量が少ない(SAX))

[Validate date] (データの検証)

このチェックボックスをオンにすると、日付形式が入力スキーマに対して厳密にチェックされます。

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルやコンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

グローバル変数

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、Talend Studioユーザーガイドをご覧ください。

使用方法

使用ルール

tFileInputXMLはエントリーコンポーネントとして使うためのものです。[Row] (行) > [Main] (メイン)リンクを使ってXMLデータのフローを作成できます。Row > Rejectリンクを使用して拒否フローを作成し、定義されたタイプに対応しないデータをフィルタリングすることもできます。この2つのリンクを使用する方法の例は、手順をご覧ください。