Talend MDMの統合マッチング - 7.3

マスターデータ管理の例

EnrichVersion
7.3
EnrichProdName
Talend Data Fabric
Talend MDM Platform
EnrichPlatform
Talend Data Stewardship
Talend MDM Server
Talend MDM Web UI
Talend Studio
task
データガバナンス > データ検証
データクオリティとプレパレーション > データのマッチング
データクオリティとプレパレーション > 重複データの削除

統合マッチングでは類似のレコードをまとめ、グループの全てのレコードを連結したバージョンとなる"ゴールデン"レコードを作成します。

Talend MDMの統合マッチングでは、以下の手順を実行してデータの重複除去またはリコンサイルを行うことができます。

  • 類似するレコードを識別し、残す値を選択する。これはマッチングとサバイバーシップのプロセスとして知られています。
  • ゴールデンレコードをビルドする。
  • マージするのに人手による介入を必要とするレコードのマージングタスクを作成し、Talend Data Stewardship内に自動的にリスト表示する。
  • Talend Data Stewardship内でマージングタスクを処理する。たとえば、残った値を変更する、余分なレコードを削除するなど。
  • ステージングエリアで検証プロセスを再び実行する。

統合マッチングはステージングエリア内のレコードのみを処理します。ステージングエリアは実際には、マスターデータレコードの保存に使用されるSQLストレージのミラーです。

ステージングエリアに検証を待機するデータレコードが保存されると、MDMユーザーは検証プロセスを実行して、データを"ステージングエリア"から"マスターデータベース"に転送することができます。

MDM内の統合マッチングは、ネイティブ機能が完全に統合されており、全てのロジックがさまざまなジョブに分散せず、MDMによって所有されているという点で、ジョブを使用するデータマッチングとは異なります。