Talend Studioでは、ステージングデータコンテナーブラウザーを使用して、特定のデータコンテナーから取得したステージングデータレコードのマッチングをシミュレーションし、一致結果をチェックできます。一致する場合は、一致の詳細をチェックできます。
データコンテナーおよびデータコンテナーの参照方法の詳細は、データコンテナーをご覧ください。
始める前に
マッチングルールが定義され、データモデルに添付されていること。マッチングルールとデータモデルがMDMサーバーにデプロイ済みであること。
注: 一致シミュレーションオペレーションは、マッチングルールの定義時に使用できる組み込みブロッキングキーを考慮しません。
マッチングルールをデータモデルに添付する方法は、データモデルにマッチングルールを添付するをご覧ください。
このタスクについて
ステージングデータレコード上でマッチングオペレーションをシミュレーションするには、以下のようにします:
手順
-
[MDM Repository] (MDMリポジトリー)ツリービューで、[Data Container] (データコンテナー)ノードを展開します。
-
一致シミュレーションを実行するデータコンテナーをダブルクリックし、データコンテナーエディターを開きます。
-
[Staging Data Container] (ステージングデータコンテナー)タブをクリックし、ステージングデータコンテナービューを開きます。
-
アイコンをクリックし、全エンティティのデータレコードを取得します。
条件を定義して、取得するデータレコードを絞り込むことができます。データコンテナーの参照方法は、
データコンテナーの参照をご覧ください。
-
同じエンティティに属する複数のレコードを選択し、選択したレコードを同時に右クリックし、コンテキストメニューから[Simulate Match] (一致のシミュレーション)を選択します。
-
[Match Result] (一致結果)ダイアログボックスが開き、選択したデータレコードの一致結果を示します。
他のデータレコードのどれかと一致しないデータレコードがある場合は、そのデータレコードには別のグループが作成されます。
一致結果には次の情報が含まれます。
-
GRP_SIZE: グルーピングされた類似するステージングデータレコードの数を示します。
-
CONFIDENCE: すべての一致スコアを加重一致スコアで0と1の間の値に正規化して計算したトラストスコアを示します。
-
SCORE: データモデルエンティティに添付されているマッチングルール内に定義されたすべてのマッチングキーに基づいて計算された連結一致スコア(すなわち、2つ以上のデータレコードがどの程度類似しているか)を、小数第2位まで正確なパーセンテージ形式で示します。スコアにマウスのポインターを移動すると、小数で表現されたスコアを表示できます。
-
ATTR_SCORE: データモデルエンティティに添付されているマッチングルール内に定義された各マッチングキーに基づいて計算された一致スコアを、小数第2位まで正確なパーセンテージ形式で示します。スコアにマウスのポインターを移動すると、小数で表現されたスコアを表示できます。
-
カスタマイズされたデータレコードに基づいてマッチングオペレーションをシミュレーションすることもできます。それには、[Edit Records] (レコードの編集)ボタンをクリックし、[Edit Records] (レコードの編集)ダイアログボックスをクリックします。
データレコードをレビューし、必要に合わせて編集します。次に、[Rerun Simulation] (シミュレーションの再実行)ボタンをクリックし、新たにシミュレーションした一致結果を[Match Result] (一致結果) ダイアログボックスで確認します。
-
必要に応じて、最初の行にある[DETAILS] (詳細)フィールドをクリックし、[...]ボタンをクリックして[Match Detail] (マッチング詳細)ダイアログボックスを開きます。そこには、それらのデータレコードがどのようにマッチングされているかについての詳細が示されます。
一致の詳細を確認したら、[OK]をクリックしてダイアログボックスを閉じます。
-
マッチングシミュレーションオペレーションが終了したら、[OK]をクリックして[Match Result] (マッチング結果)ダイアログボックスを閉じます。