tMDMOutput標準プロパティ - 7.3

MDM data processing

Version
7.3
Language
日本語 (日本)
Product
Talend Data Fabric
Talend MDM Platform
Module
Talend MDM Server
Talend MDM Web UI
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > MDMコンポーネント > MDMデータ処理コンポーネント
データガバナンス > サードパーティーシステム > MDMコンポーネント > MDMデータ処理コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > MDMコンポーネント > MDMデータ処理コンポーネント

このプロパティはStandardジョブフレームワークで実行されているtMDMOutputを設定するために使います。

Standard tMDMOutputコンポーネントはTalend MDMファミリーのコンポーネントです。

このフレームワーク内のコンポーネントは、すべてのTalend製品で使用できます。

基本設定

[Property Type] (プロパティタイプ)

[Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかで次の設定を行います。

 

[Built-In] (組み込み): プロパティデータは一元的に保管されません。

 

[Repository] (リポジトリー): プロパティを保管するリポジトリーファイルを選択します。続くフィールドは、取得したデータを使って自動的に入力されます。

[Input Schema] (入力スキーマ)および[Edit schema] (スキーマを編集)

入力スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは組み込まれるか、リポジトリーにリモートで保存されます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを使用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

[Sync column] (カラムの同期)をクリックして、前のコンポーネントからスキーマを収集します。

 

[Built-In] (組み込み): このコンポーネントに対してのみスキーマを作成し、ローカルに保管します。関連項目: Talend Studioユーザーガイドを参照してください。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。関連項目: Talend Studioユーザーガイドを参照してください。

[Build the document] (ドキュメント作成)

フラットスキーマからドキュメントを作成する場合は、このチェックボックスをオンにします。この場合は、コンポーネントをダブルクリックし、開いたダイアログボックスでスキーマをマッピングします。

チェックボックスがオフの場合は、[Predefined XML document] (事前定義されたXMLドキュメント)リストから、ドキュメントを含むスキーマのカラムを選択する必要があります。

[Result of the XML serialization] (XMLシリアライズの結果)

XMLデータを保持するXML出力カラムの名前をリスト表示します。

[Use an existing connection] (既存の接続を使用)

定義済みのtMDMConnectionコンポーネントを使用する場合は、このチェックボックスをオンにします。

[MDM version] (MDMバージョン)

デフォルトでは、Server 6.0が選択されています。既存のジョブをこの新しいバージョンに移行することをお勧めしますが、[Server 5.6] (サーバー5.6)オプションを使って、ジョブの移行プロセスを容易にし、6.0サーバーで変更を行わずにジョブの動作を続けることができます。そのためには、サーバー上のオプションを有効にして、そのようなジョブからの要求を受け入れて変換する必要があります。

URL

MDMサーバーのURLを入力します。

Username (ユーザー名)Password (パスワード)

MDMサーバーのユーザー認証データを入力します。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。

注:

ユーザーに Talend MDM でロールが割り当てられていることを確認します。これにより、ユーザーはジョブまたはその他のWebサービス呼び出しを通じて接続できるようになります。詳細は、 Talend Studioユーザーガイドを参照してください。

[Data Model] (データモデル)

書き込むデータの検証を行う基準となるデータモデルの名前を入力します。

データコンテナー

マスターデータを書き込むデータコンテナーの名前を入力します。
注:

このデータコンテナーは既に存在している必要があります。

Type (タイプ)

[Master] (マスター)または[Staging] (ステージング)を選択して、アクションを実行するデータベースを指定します。

[Return Keys] (Returnキー)

[Columns corresponding to IDs in order] (IDに順番に対応するカラム): 作成されるアイテムのReturnキー値(プライマリキー)を保管する出力カラムを順番に設定します。

[Is Update] (更新)

変更されたフィールドを更新するには、このチェックボックスをオンにします。

このチェックボックスをオフのままにすると、すべてのフィールドが変更されたフィールドに置き換えられます。

[Fire a Create/Update event] (作成/更新イベントの起動)

実行したアクションを変更レポートに追加するには、このチェックボックスをオンにします。

[Source Name] (ソース名): 引用符の間に、変更を実行するために使うアプリケーションの名前を入力します。

[Enable verification by before saving process] (保存処理前の検証を有効にする): 保存する前に、追加したばかりのコミットを確認するには、このチェックボックスをオンにします。

注: [Enable verification by before saving processes] (保存処理前の検証を有効にする)チェックボックスがオンで、データレコードの検証が失敗した場合、挿入/更新操作は何の表示もなく失敗します。

保存前のプロセスについては、Talend Studioユーザーガイドを参照してください。

[Add task id] (タスクIDの追加)

タスクの識別子を設定するには、このチェックボックスをオンにします。tMDMOutputコンポーネントは、タスクを追跡する方法を提供するMDMサーバーにこのIDを書き込みます。

  • [Custom] (カスタム)を選択して、[Task id] (タスクID)フィールドで独自のIDを指定します。IDは引用符の間に入力する必要があります。

  • [Use a column from the schema] (スキーマのカラムを使う)を選択して、タスクIDとして使うスキーマのカラムを選択できるドロップダウンリストを表示します。

[Use partial update] (部分更新の使用)

ソースXMLストリームのコンテンツに基づいて、既存のアイテム(エンティティ)の複数回出現するエレメント(属性)を更新する必要がある場合は、このチェックボックスをオンにします。

選択したら、以下に示すパラメーターを設定する必要があります。

- [Pivot] (ピボット): 目的のアイテムでデータを追加、置換、または削除する必要がある、複数回出現するサブエレメントへのxpathを入力します。

たとえば、以下の既存のアイテムに子サブエレメントを追加する必要がある場合:

<Person>
    <Id>1</Id> <!-- record key is 
     mandatory -->
    <Children>
        <Child>[1234]</Child> 
     <!-- FK to a Person Entity -->
    </Children>
</Person>
この場合、この[Pivot] (ピボット)フィールドに入力するXpathは次のようになっている必要があります: /Person/Children/Child。ここで[Overwrite] (上書き)チェックボックスはオフです。

さらに、既存のアイテムの子サブエレメントを置き換える必要がある場合:

<Person>
  <Id>1</Id> 
  <Addresses>
    <Address>
      <Type>office</Type>
        (...address elements 
         are here....)
    </Address>
    <Address>
      <Type>home</Type>
        (...address elements 
         are here....)
    </Address>
  <Addresses>
</Person>
この場合、この[Pivot] (ピボット)フィールドに入力するXpathは次のようになっている必要があります: /Person/Addresses/Address。ここで、[Overwrite] (上書き)チェックボックスはオンで、[Key] (キー)フィールドは/Typeに設定されています。

このような例では、MDMのアイテムにofficeの住所しかないと仮定すると、officeの住所が置き換えられ、homeの住所が追加されます。

- [Overwrite] (上書き): 元のサブエレメントを入力サブエレメントで置換または更新する必要がある場合は、このチェックボックスをオンにします。サブエレメントを追加する場合は、オフのままにしておきます。

- [Key] (キー): ソースXMLのサブエレメントをアイテムのサブエレメントと一致させるのに役立つピボットに相対的なxpathを入力します。キーが指定されていない場合、XPathがソースXMLのサブエレメントと一致するアイテムのすべてのサブエレメントが置き換えられます。複数のサブエレメントがキーと一致する場合、MDMは最初に見つかったものを更新します。キーに一致するサブエレメントがない場合は、コレクションの最後に追加されます。

-[Position] (位置): 後ろに新しいエレメント(keyと一致しないもの)が追加される位置を示す数字を入力します。このフィールドに値を指定しない場合、新しいエレメントは最後に追加されます。

- [Delete] (削除): 元のサブエレメントから1つ以上のサブエレメントを削除する必要がある場合は、このチェックボックスをオンにします。

たとえば、以下の既存のアイテムから2つの家を削除する必要がある場合:

<Person>
	<Id>1</Id>
	<Name>p1</Name>
	<Houses>
		<House>[1]</House>
		<House>[2]</House>
		<House>[3]</House>
	</Houses>
	<Children>
		<Child>
			<Name>k1</Name>
			<Age>1</Age>
			<Habits>
				<Habit>Basketball</Habit>
				<Habit>Football</Habit>
				<Habit>Tennis</Habit>
				<Habit>Boxing</Habit>
			</Habits>
		</Child>
		<Child>
			<Name>k2</Name>
			<Age>2</Age>
		</Child>
	</Children>
</Person>
この場合、この[Pivot] (ピボット)フィールドに入力するXpathは次のようになっている必要があります: /Person/Houses/House。ここで、[Delete] (削除)チェックボックスはオンで、[Key] (キー)フィールドは.またはemptyに設定されています。さらに、次のようにソースXMLストリームを入力する必要があります。
<Person>
	<Id>1</Id>
	<Houses>
		<House>[1]</House>
		<House>[2]</House>
	</Houses>
</Person>

この場合、House [1] House [2]が削除されます。

部分更新操作のその他の例については、tMDMOutputを使った部分更新操作の例を参照してください。

[Die on error] (エラー発生時に強制終了)

このチェックボックスをオンにすると、エラーの発生した行がスキップされ、エラーが発生していない行の処理が完了されます。必要に応じて[Row] (行) > [Rejects] (リジェクト)リンクを使用してエラーの発生している行を取得できます。

詳細設定

[Extended Output] (拡張出力)

マスターデータをバッチでコミットするには、このチェックボックスをオンにします。[Rows to commit] (コミット行数)フィールドでバッチごとの行数を指定できます。

[Configure Xml Tree] (Xmlツリーの設定)

書き込むマスターデータのXML構造の作成に役立つインターフェイスを開きます。

[Group by] (グループ化)

マスターデータの再グループ化に使うカラムを選択します。

Create empty element if needed (必要に応じて空のエレメントを作成)

このチェックボックスは、デフォルトで選択されています。XML構造の作成を可能にするインターフェイスの[Related Column] (関連カラム) のコンテンツがnullの場合、またはXMLノードに関連付けられているカラムがない場合、このオプションでは必要な場所に開始タグと終了タグが作成されます。

[Advanced separator (for number)] (高度な区切り文字:数値)

デフォルトで使われる区切り記号の数を変更する場合は、このチェックボックスをオンにします。

[- Thousands separator:] (桁区切り記号:) 引用符の間に桁区切り記号を入力します。

[- Decimal separator:] (小数点区切り記号:) 引用符の間に小数点区切り記号を入力します。

Generation mode (生成モード)

利用可能なメモリに応じて、適切な生成モードを選択します。利用可能モードは以下のとおりです:

  • Slow and memory-consuming (Dom4j) (低速およびメモリ消費多)

    注:

    このオプションでは、dom4jを使用して、複雑なXMLファイルを処理できます。

  • [Fast with low memory consumption] (高速およびメモリ消費少)

[Encoding] (エンコーディング)

一覧からエンコードの種類を選択するか、[Custom] (カスタム)を選択して手動で定義します。これは、サーバー上のデータを操作するための必須フィールドです。

[tStatCatcher Statistics] (tStatCatcher統計情報)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルで処理メタデータが収集されます。

グローバル変数

[Global Variables] (グローバル変数)

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。

NB_LINE_REJECTED: 拒否された行の数。これはAfter変数で、整数を返します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

このコンポーネントを使ってデータレコードを書き込み、特定の区切り記号でフィールドを区切ります。

このコンポーネントを使ってジョブのタイムアウト値を増やすと、多数のデータレコードの処理に役立ちます。詳細については、Talend Help Center (https://help.talend.com)のMDMコンポーネントを使うジョブのタイムアウト値という記事で、JVMパラメーターの詳細な実行設定を参照してください。