Festlegen eines Datenmodells in der Kampagne - Cloud

Einführungshandbuch für Talend Cloud Data Stewardship

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Stewardship
Content
Data Governance > Datenmodellverwaltung
Data Governance > Kampagnenverwaltung
Datenqualität und Datenaufbereitung > Deduplizierung von Daten
Datenqualität und Datenaufbereitung > Handhabung von Tasks
Last publication date
2024-03-11

Datenmodelle bestimmen die Struktur der zu verwaltenden Daten. Sie dienen der syntaktischen und semantischen Validierung der Daten.

Sie können für alle in einem Datenmodell aufgeführten Attribute eine Zugriffsberechtigung pro Rolle festlegen.

Prozedur

  1. Klicken Sie auf der Seite Add campaign (Kampagne hinzufügen) auf Data model (Datenmodell) und wählen Sie in der Modellliste die Datenstruktur aus, die Sie in der Kampagne verwenden möchten.
    Die Modellliste bietet Zugriff auf alle definierten Datenmodelle.
    Ansicht Data model (Datenmodell).
  2. Wählen Sie die Schaltflächen neben den Attributen in der Datenstruktur aus, um Berechtigungen pro Attribut und pro Rolle/Data Steward festzulegen und vorzugeben, wer welche Attribute anzeigen/bearbeiten kann.
    Icon (Symbol) Beschreibung
    Symbol „Read/write access (Lese-/Schreibzugriff)“ Stellt einen Lese-/Schreibzugriff für das Attribut im Datenmodell bereit.
    Symbol „Read access (Lesezugriff)“ Stellt nur einen Lesezugriff für das Attribut im Datenmodell bereit.

    Dieser Zugriffstyp kann sich als nützlich erweisen, wenn der Data Steward Informationen einsehen muss, um relevante Entscheidungen treffen zu können, der Wert der Daten jedoch nicht geändert werden darf. Das betrifft beispielsweise eindeutige Kennungen anderer Elemente, die mit der vom Steward angezeigten Entität verknüpft sind, oder Daten, von denen Sie wissen, dass sie zuverlässig sind und die unverändert bleiben müssen.

    Symbol „No access (Kein Zugriff)“ Stellt keinen Zugriff auf das Attribut bereit.

    Das Verbergen eines Attributs kann nützlich sein, wenn es sich um sensible Informationen handelt, die vom Data Steward nicht eingesehen werden sollten, z. B. Finanzdaten. Ein anderes Beispiel für Attribute, die verborgen werden sollten, sind Informationen, die für den Steward nicht aussagekräftig und somit nur störend sind, z. B. technische Kennungen, die jedoch als Teil der Task propagiert werden müssen.

    Example

    In dieser Kampagne gewähren Sie den Kampagnenteilnehmern mit der Rolle Account analyst (Kontoanalyst) einen Nur-Lesen-Zugriff auf das Kennungsattribut. Andere Teilnehmer hingegen verfügen über einen Lese-/Schreibzugriff.

  3. Wählen Sie in den Listen Survivorship Rule (Survivorship-Regel) neben den Attributen eine Regel aus.
    Anhand dieser Regeln können die Attributwerte ermittelt werden, die die Stammdatensätze beim Laden von Daten in die Kampagne definieren. Data Stewards können diese Auswahl dann manuell ändern.
    • First valid (Erste gültige): Auswahl der ersten Quelle, die in Bezug auf die im zugeordneten Datenmodell definierten Constraints einen gültigen Wert enthält. Ein Wert gilt als gültig, wenn er allen definierten Constraints und Regeln entspricht. Der „erste Wert“ wird von der Reihenfolge der Datensätze bei der Erstellung der Task vorgegeben.
    • First not null (Erste nicht null): Auswahl der ersten Quelle mit einem Wert ungleich null, wobei der „erste Wert“ von der Reihenfolge der Datensätze bei der Erstellung der Task vorgegeben wird.
    • Most common (Häufigster): Auswahl des Attributwerts der Duplikate aus einer oder mehreren Datenquellen, der am häufigsten vorkommt.
    • Most redent (Neuester): Auswahl des Attributwerts der Duplikate aus einer oder mehreren Datenquellen, der zuletzt verwendet wurde. Das erfolgt auf der Grundlage der Metadaten des letzten Aktualisierungsdatums.
    • Most trusted (Vertrauenswürdigster): Auswahl des vertrauenswürdigsten Attributwerts der Duplikate nach dem Trust Score, den Sie bei der Erstellung der Kampagne oder beim Laden der Tasks in die Kampagne festgelegt haben. Wurde kein Trust Score angegeben, dann funktioniert diese Option nicht.
    Sie können eine Regel für alle Attribute vorgeben, indem Sie sie in der Liste in der oberen rechten Ecke des Formulars auswählen. Wenn ein bestimmter Algorithmus nicht angewendet werden kann, wird automatisch die Regel First not null (Erster Wert ungleich null) ausgewählt. Wenn Sie bei der Kampagnendefinition z. B. keinen Trust Score festlegen und die Option Most trusted (Vertrauenswürdigster Wert) auswählen, wird stattdessen die Option First not null (Erster Wert ungleich null) zugewiesen. Desgleichen wird First not null (Erster Wert ungleich null) verwendet, wenn Sie Most common (Häufigster Wert) oder First valid (Erster gültiger Wert) auswählen und die Datenduplikate keine gemeinsamen oder gültigen Werte enthalten.

    Example

    Nachstehend einige Beispiele, die illustrieren, wie die Survivorship-Regeln die Auswahl des Werts zur Generierung der Stammdatensätze steuern.
    First valid (Erster gültiger Wert): E-Mailadresse:
    • Wenn der erste Wert nicht gültig ist, jedoch der zweite, dann wird die zweite E-Mail ausgewählt.
    • Sollten alle E-Mail-Adressen ungültig sein, dann wird der erste Wert ungleich null verwendet.
    First not null (Erster Wert ungleich null): Vorname:
    • Wenn der erste Wert leer ist, der zweite jedoch nicht, dann wird der zweite Vorname ausgewählt.
    • Sind alle Vornamen leer, dann enthält der Stammdatensatz keinen Vornamen.
    Most common (Häufigster Wert): Nachname:
    • Wenn die Nachnamen in zwei Quelldatensätzen identisch sind, wird dieser Wert verwendet.
    • Wenn sich die Nachnamen in allen Quelldatensätzen unterscheiden, wird der erste Wert ungleich null ausgewählt.
    Most recent (Neuester Wert): Telefonnummer und Zeitstempel:
    • Die Telefonnummer mit dem neuesten Zeitstempel wird verwendet.
    • Wenn alle Telefonnummern denselben Zeitstempel aufweisen, wird der erste Wert ungleich null ausgewählt.
    Most trusted (Vertrauenswürdigster Wert): Adresse:
    • Wenn alle Adressen in den Quelldatensätzen über einen Trust Score verfügen, wird der Wert mit dem höchsten Score verwendet.
    • Wenn alle Adressen in den Quelldatensätzen einen Trust Score besitzen und zwei Scores identisch sind, wird der erste der identischen Scores verwendet.
    • Wenn für keine Adresse ein Trust Score angegeben wurde, wird der erste Wert ungleich null ausgewählt.
  4. Nach Wunsch können Sie auf Add campaign (Kampagne hinzufügen) klicken, um die Angaben in der Anwendung zu speichern und das Erstellungsformular zu einem späteren Zeitpunkt zu vervollständigen.