統合マッチングによって作成されたタスクのマージ処理 - 7.3

Talend Data Stewardshipの例

EnrichVersion
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Data Stewardship
task
データガバナンス > キャンペーンの管理
データガバナンス > タスクの割り当て
データガバナンス > データモデルの管理
データクオリティとプレパレーション > タスク管理

Talend Data Stewardshipで自動的に作成されたマージングキャンペーンに対するアクセス権を持つデータスチュワードは、マージングタスクにアクセスし、重複レコードを1つのマスターレコードに手動でマージする必要があります。これにより解決済みのデータがTalend MDM Web UIのステージングエリアに戻されます。

マージングキャンペーンでは、マスターフィールドの値のみを変更できますが、ソースフィールドの値は変更できません。

データ値をマージして変更を検証すると、タスクが解決済み状態に移行します。少なくとも1つの無効な値が含まれている限り、タスクを検証することはできません。

この例では、一致ルールに対して顧客レコードを検証する統合マッチング処理の結果として、Talend MDMから重複レコードが生成されています。

Talend Data Stewardshipでは、最初にマスターレコードを作成する属性がTalend MDMで作成されたサバイバーシップルールに基づいて決定され、マージングキャンペーンを使用してサーバー上にデプロイされます。ただし、レコード属性ごとにサバイバーシップルールを手動で変更するか、まったく新しい値を入力して、最も正確かつ信頼性の高いマスターレコードを完成させる必要があります。

始める前に

  • キャンペーンオーナーのロールを持つMDM管理者はTalend MDM Web UIの顧客レコードを検証して、人手による介入を必要とする重複をTalend Data Stewardshipにデプロイしています。
  • キャンペーン所有者にはマージングキャンペーンへのアクセスが付与されています。
  • キャンペーン所有者からキャンペーンのタスクが割り当てられているはずです。割り当てられていない場合は、自分にタスクを割り当てることができます。

手順

  1. データスチュワードとしてログインします。
  2. [Task] (タスク)ページで、右上の検索アイコンをクリックし、tmdmと入力して、アクセスが許可された統合マッチングによって作成された[Merging] (マージング)キャンペーンのみをフィルタリングして一覧表示します。
  3. キャンペーン名をクリックすると、割り当てられたタスクのリストが表示されます。
  4. カラムまたは右側のパネルに表示されているCharts(チャート)またはPattern(パターン)ビューのカラム上部のクオリティバーを使用して、作業対象データをフィルタリングします。
  5. 左上の下向き矢印をクリックして、リストのすべてのタスクを展開するか、特定のタスクの下向き矢印をクリックして展開します。
  6. サバイバーシップルールを設定して、顧客レコードから属性を選択し、マスターレコードを作成します。いくつかのアプローチが考えられます:
    • レコードの1つまたは複数の属性に対してサバイバーシップルールを手動で設定する: タスクのマスターレコード内の属性をポイントし、表示されるアイコンから、適用するサバイバーシップルールを選択します。

      • : 重複の中で最初の有効な属性値を選択します。「先頭」はタスク作成時のレコードの順番によって定義されます。

      • : 重複の中で最も共通する属性値を選択します。

      • : 重複の中で最も直近の属性値を選択します。

      • : 異なるソースからの重複の中で最も信頼されている属性値を選択します。

        選択した属性にルールが適用されない場合、アイコンはグレー表示されます。

    • 複数のレコードの1つの属性に対して、サバイバーシップルールを手動で設定します。

      1. カラム見出しをクリックし、右側のパネルでSurvivorship (サバイバーシップ)セクションを参照します。
      2. ボタンをクリックし、Survivorship rule (サバイバーシップルール)リストから、選択したカラムのすべての値に適用されるルールを選択します。
      3. [Submit] (送信)をクリックして最も一般的な名前の値を選択し、タスクのマスターレコードに追加します。
    • 指定したソース属性の値をマスターレコードの値として選択します: ソース属性をポイントし、上向き矢印をクリックしてマスターレコードで選択した値を設定します。
  7. 上記の手順を繰り返して、レコードを結合し、割り当てられたすべてのタスクのマスターレコードを作成します。
    特定のカラムの値を固定する必要がある場合は、右側のパネルに表示されているファンクションを使用して一括変換できます。
  8. 変更したデータレコードの横にあるアイコンをクリックして、タスクの検証準備ができたことを示します。
    レコードの背景が緑で表示され、ロックアイコンは自動的に次のレコードに移動します。検証準備済みのレコードは再編集できますが、タスクの背景色はダークグレーの初期状態に戻ります。タスクを検証準備完了としてマークするには、カギのアイコンをもう一度クリックする必要があります。

    ロックアイコンの背景色が赤色の場合は、まずタスクの無効な値を修正してから検証準備完了としてマークする必要があります。

  9. ページ右上の[Validate Choices] (選択の検証)をクリックして、レコードに対して行ったカスタマイズを検証します。
    マスターレコードが作成され、検証されたレコードがリストから移動され、解決済みとしてマークが付けられます。

タスクの結果

承認されたタスクはワークフロー内の解決済み状態に移行し、解決済みとしてマークされます。リジェクトされたタスクは、ワークフローの最初のステップに移行され、新規としてマークされます。

次のタスク

Talend MDM Web UIのデータスチュワードは、レコードの状態の変更を考慮に入れるため、ステージングの検証を再度実行する必要があります。