ステージングデータレコードのマッチングのシミュレーション - 7.1

Talend Data Fabric Studio ユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Fabric
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

Talend Studioでは、ステージングデータコンテナブラウザを使用して、特定のデータコンテナから取得したステージングデータレコードのマッチングをシミュレーションし、一致結果をチェックすることができます。一致する場合は、一致の詳細をチェックすることができます。

データコンテナおよびデータコンテナの参照方法の詳細は、データコンテナを参照して下さい。

始める前に

一致ルールが定義され、データモデルに添付されていること。一致ルールとデータモデルがMDMサーバーにデプロイ済みであること。
注: 一致シミュレーションオペレーションは、一致ルールの定義時に使用できる組み込みブロッキングキーを考慮しません。

一致ルールをデータモデルに添付する方法は、データモデルに一致ルールを添付するを参照して下さい。

このタスクについて

ステージングデータレコード上でマッチングオペレーションをシミュレーションするには、以下のようにします:

手順

  1. [MDM Repository] (MDMリポジトリー)ツリービューで、[Data Container] (データコンテナ)ノードを展開します。
  2. 一致シミュレーションを実行するデータコンテナをダブルクリックし、データコンテナエディターを開きます。
  3. [Staging Data Container] (ステージングデータコンテナ)タブをクリックし、ステージングデータコンテナビューを開きます。
  4. アイコンをクリックし、全エンティティのデータレコードを取得します。
    条件を定義して、取得するデータレコードを絞り込むことができます。データコンテナの参照方法は、データコンテナの参照を参照して下さい。
  5. 同じエンティティに属する複数のレコードを選択し、選択したレコードを同時に右クリックし、コンテキストメニューから[Simulate Match] (一致のシミュレーション)を選択します。
  6. [Match Result] (一致結果)ダイアログボックスが開き、選択したデータレコードの一致結果を示します。
    他のデータレコードのどれかと一致しないデータレコードがある場合は、そのデータレコードには別のグループが作成されます。
    一致結果には次の情報が含まれます。
    • GRP_SIZE: グループ化された類似するステージングデータレコードの数を示します。

    • CONFIDENCE: 全ての一致スコアを加重一致スコアで0と1の間の値に正規化して計算した信頼スコアを示します。

    • SCORE: データモデルエンティティに添付されている一致ルール内に定義された全ての一致キーに基づいて計算された連結一致スコア(すなわち、2つ以上のデータレコードがどの程度類似しているか)を、小数第2位まで正確なパーセンテージ形式で示します。スコアにマウスのポインターを移動すると、小数で表現されたスコアを表示することができます。

    • ATTR_SCORE: データモデルエンティティに添付されている一致ルール内に定義された各一致キーに基づいて計算された一致スコアを、小数第2位まで正確なパーセンテージ形式で示します。スコアにマウスのポインターを移動すると、小数で表現されたスコアを表示することができます。

  7. カスタマイズされたデータレコードに基づいてマッチングオペレーションをシミュレーションすることもできます。それには、[Edit Records] (レコードの編集)ボタンをクリックし、[Edit Records] (レコードの編集)ダイアログボックスをクリックします。
    データレコードをレビューし、必要に合わせて編集します。次に、[Rerun Simulation] (シミュレーションの再実行)ボタンをクリックし、新たにシミュレーションした一致結果を[Match Result] (一致結果) ダイアログボックスで確認します。
  8. 必要に応じて、最初の行にある[DETAILS] (詳細)フィールドをクリックし、[...]ボタンをクリックして[Match Detail] (マッチング詳細)ダイアログボックスを開きます。そこには、それらのデータレコードがどのようにマッチングされているかについての詳細が示されます。
    一致の詳細を確認したら、[OK]をクリックしてダイアログボックスを閉じます。
  9. マッチングシミュレーションオペレーションが終了したら、[OK]をクリックして[Match Result] (マッチング結果)ダイアログボックスを閉じます。