Talend MDMの統合マッチング - 8.0

マスターデータ管理の例

Version
8.0
Language
日本語 (日本)
EnrichDitaval
MDM Platform
Product
Talend Data Fabric
Talend MDM Platform
Module
Talend Data Stewardship
Talend MDM Server
Talend MDM Web UI
Talend Studio
Content
データガバナンス > データ検証
データクオリティとプレパレーション > データのマッチング
データクオリティとプレパレーション > 重複データの削除

統合マッチングでは類似のレコードをまとめ、グループのすべてのレコードを連結したバージョンとなる"ゴールデン"レコードを作成します。

Talend MDMの統合マッチングでは、以下の手順を実行してデータの重複除去またはリコンサイルを行うことができます。

  • 類似するレコードを識別し、残す値を選択する。これはマッチングとサバイバーシップのプロセスとして知られています。
  • ゴールデンレコードをビルドする。
  • マージするのに人手による介入を必要とするレコードのマージングタスクを作成し、Talend Data Stewardship内に自動的にリスト表示する。
  • Talend Data Stewardship内でマージングタスクを処理する。たとえば、残った値を変更する、余分なレコードを削除するなど。
  • ステージングエリアで検証プロセスを再び実行する。

統合マッチングはステージングエリア内のレコードのみを処理します。ステージングエリアは実際には、マスターデータレコードの保存に使用されるSQLストレージのミラーです。

ステージングエリアに検証を待機するデータレコードが保存されると、MDMユーザーは検証プロセスを実行して、データを"ステージングエリア"から"マスターデータベース"に転送できます。

MDM内の統合マッチングは、ネイティブ機能が完全に統合されており、すべてのロジックがさまざまなジョブに分散せず、MDMによって所有されているという点で、ジョブを使用するデータマッチングとは異なります。