Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Verwendung von über integriertes Matching erstellte Zusammenführungstasks

Data Stewards mit Zugriffsrechten auf die automatisch in Talend Cloud Data Stewardship erstellte Kampagne Merging (Zusammenführen) müssen auf die Zusammenführungstasks zugreifen und doppelte Datensätze manuell in einem Stammdatensatz zusammenführen. Dadurch werden aufgelöste Daten in den Staging-Bereich in Talend MDM Web UI zurückgesendet.

In einer Merging (Zusammenführen)-Kampagne können Sie ausschließlich Werte in den Stammfeldern ändern. Änderungen an den Werten in den Quellfeldern sind nicht möglich.

Durch die Zusammenführung von Datenwerten und die Validierung der vorgenommenen Änderungen wird die Task in den Zustand „Resolved (Erledigt)“ überführt. Eine Task kann nicht validiert werden, solange sie noch mindestens einen ungültigen Wert enthält.

In diesem Beispiel stammen die doppelten Datensätze aus Talend MDM und sind das Ergebnis integrierter Matching-Prozesse, die die Validierung von Kundendatensätzen durch den Vergleich mit einer Match-Regel ermöglichen.

Talend Cloud Data Stewardship legt zunächst fest, welche Attribute zur Erstellung des Stammdatensatzes verwendet werden sollen. Dies erfolgt auf der Grundlage der in Talend MDM erstellten und mit der Kampagne Merging (Zusammenführen) auf dem Server implementierten Survivorship-Regeln. Allerdings müssen Sie die Survivorship-Regeln für jedes Datensatzattribut ggf. manuell anpassen oder vollständig neue Werte eingeben, um den Stammdatensatz so genau und zuverlässig wie möglich zu machen.

Vorbereitungen

  • Ein MDM-Administrator mit der Rolle eines Kampagnenverantwortlichen hat die Kundendatensätze in Talend MDM Web UI validiert, sodass die Duplikate, die einen menschlichen Eingriff erfordern, in Talend Cloud Data Stewardship implementiert wurden.
  • Ein Kampagnenverantwortlicher hat Ihnen Zugriff auf die Merging (Zusammenführen)-Kampagne gewährt.
  • Ein Kampagnenverantwortlicher hat Ihnen Tasks in der Kampagne zugewiesen. Andernfalls können Sie sich selbst Tasks zuweisen.

Prozedur

  1. Melden Sie sich als Data Steward an.
  2. Klicken Sie auf der Seite Tasks auf das Suchsymbol in der oberen rechten Seitenecke und geben Sie tmdm ein, um die Liste zu filtern, sodass nur die über integriertes Matching erstellten Merging (Zusammenführen)-Kampagnen angezeigt werden, für die Sie über Zugriffsrechte verfügen.
  3. Klicken Sie auf den Namen der Kampagne, um die Liste der Ihnen zugewiesenen Tasks zu öffnen.
  4. Über die Qualitätsleiste am oberen Rand jeder Spalte können Sie die Daten ausfiltern, die Sie in den Ansichten Chart (Diagramm) oder Pattern (Muster) im rechten Fensterbereich bearbeiten möchten.
  5. Klicken Sie auf den Nach-unten-Pfeil in der oberen linke Ecke, um die Anzeige auf alle Tasks in der Liste zu erweitern, bzw. auf den Nach-unten-Pfeil einer bestimmter Task, um diese zu erweitern.
  6. Legen Sie Survivorship-Regeln fest, um Attribute in den Kundendatensätzen auszuwählen und diese zur Generierung der Stammdatensätze zu verwenden. Dazu sind verschiedene Möglichkeiten gegeben:
    • Legen Sie manuell eine Survivorship-Regel für eines oder mehrere Attribute eines Datensatzes fest: Erweitern Sie die Task, positionieren Sie den Mauszeiger auf einem Attribut im Stammdatensatz einer Task und wählen Sie unter den daraufhin angezeigten Symbolen die anzuwendende Survivorship-Regel aus.
      Position der Symbole zur manuellen Festlegung einer Survivorship-Regel für eines oder mehrere Attribute
      • Use first valid attribute icon: Wählt den ersten gültigen Attributwert unter den Duplikaten aus. Der „erste Wert“ wird von der Reihenfolge der Datensätze bei der Erstellung der Task vorgegeben.

      • Use most common icon (Symbol Häufigstes verwenden): Wählt den am häufigsten vorkommenden Attributwert unter den Duplikaten aus.

      • Use most recent value icon (Symbol Neuesten Wert verwenden: Wählt den am ¨neuesten Attributwert unter den Duplikaten aus.

      • Use most trusted icon (Symbol Vertrauenswürdigsten Wert verwenden): Wählt den vertrauenswürdigsten Attributwert unter den aus verschiedenen Quellen stammenden Duplikaten aus.

        Die Symbole werden grau abgeblendet, wenn eine Regel auf das ausgewählte Attribut nicht zutrifft.

    • Legen Sie manuell eine Survivorship-Regel für ein Attribut mehrerer Datensätze fest:

      1. Klicken Sie auf eine Spaltenüberschrift und gehen Sie im rechten Fensterbereich zum Bereich Survivorship.
      2. Klicken Sie auf Apply survivorship rule... (Survivorship-Regel anwenden...) und wählen Sie in der Liste Rule (Regel) die Regel aus, die auf alle Werte in der ausgewählten Spalte angewendet werden soll.
      3. Klicken Sie auf Submit (Senden), um die am häufigsten vorkommenden Namenswerte auszuwählen und sie zu den Stammdatensätzen der Tasks hinzuzufügen.
    • Wählen Sie den Wert eines bestimmten Quellattributs aus, um ihn als Wert für den Stammdatensatz zu verwenden: Zeigen Sie auf ein Quellattribut und klicken Sie auf den Nach-oben-Pfeil, um den ausgewählten Wert im Stammdatensatz einzustellen.
  7. Wiederholen Sie den obigen Schritt, um Datensätze zusammenzuführen und Stammdatensätze für alle der Ihnen zugewiesenen Tasks zu erstellen.
    Wenn eine Spalte mehrere Werte enthält, die berichtigt werden müssen, können Sie diese mithilfe der im rechten Fensterbereich aufgeführten Funktionen gemeinsam transformieren.
  8. Klicken Sie auf das Symbol Mark the task as ready for validation icon neben dem von Ihnen geänderten Datensatz, um anzugeben, dass die Task jetzt validiert werden kann.
    Der Datensatz wird durch einen grünen Hintergrund gekennzeichnet und das Sperrsymbol automatisch zum nächsten Datensatz verschoben. Sie können nach wie vor Änderungen an den zu validierenden Datensätzen vornehmen. Dadurch wird die Task jedoch in ihren Ausgangsstatus mit dunkelgrauem Hintergrund zurückgesetzt. Sie müssen dann erneut auf das Sperrsymbol klicken, um die Task wieder als validierungsbereit zu kennzeichnen.

    Wenn das Sperrsymbol einen roten Hintergrund aufweist, müssen Sie zuerst den ungültigen Wert in der Task berichtigen, bevor Sie die Task für eine Validierung kennzeichnen können.

  9. Klicken Sie auf Validate (Validieren) in der oberen rechten Ecke der Seite, um die von Ihnen an den Datensätzen vorgenommenen Änderungen zu validieren.
    Es werden Stammdatensätze erstellt und die validierten Datensätze werden aus der Liste entfernt und als erledigt (aufgelöst) gekennzeichnet.

Ergebnisse

Genehmigte Tasks werden in den Status „Resolved (Erledigt)“ im Workflow überführt und als erledigt (aufgelöst) gekennzeichnet. Zurückgewiesene Tasks kehren in den Ausgangsstatus im Workflow zurück und werden als neu gekennzeichnet.

Nächste Maßnahme

Ein Data Steward in Talend MDM Web UI muss die Staging-Validierung dann erneut durchführen, damit die Änderung des Datensatzstatus berücksichtigt wird.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!