Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Definieren eines Datenmodells für eine Gruppierungskampagne

In diesem Beispiel erstellen Sie ein Datenmodell, um die Struktur der Daten festzulegen, die in der Kampagne Site deduplication (Standort-Deduplizierung) verwaltet werden sollen. Diese Kampagne ermöglicht den Data Stewards die Kennzeichnung von nahezu identischen Duplikaten in einem über einen Talend-Job extrahierten Daten-Sample.

Talend Cloud Data Stewardship verfügt über Datenmodell-Awareness, die eine syntaktische und semantische Validierung der Daten ermöglicht. Sie können die Attribute im Datenmodell definieren und deren Typ unter den vordefinierten Standard- oder semantischen Typen auswählen.

Prozedur

  1. Wählen Sie Data models (Datenmodelle) > Add data model (Datenmodell hinzufügen) aus.
  2. Geben Sie einen Namen und eine Beschreibung für das neue Modell in die Felder Name und Description (Beschreibung) ein. Die optionalen Felder sind mit einem * neben ihrem Namen gekennzeichnet.
  3. Bestimmen Sie im Bereich Attributes (Attribute) die Spalten, die Sie in das Datenmodell aufnehmen möchten. Gehen Sie dazu vor wie folgt:
    1. Geben Sie im Feld Identifier (Kennung) die technische Kennung für die erste Spalte ein.
    2. Geben Sie in den entsprechenden Feldern nach Bedarf einen Namen und eine Beschreibung für die Spalte ein.
      Der Name, den Sie im Feld Name eingeben, wird in der Taskliste angezeigt. Wenn kein Name eingegeben wird, wird die technische Kennung angezeigt.
    3. Wählen Sie in der Liste der Attributtypen den Typ der Spalte aus.
      Spaltentypen in der Liste der Attributtypen

      Die Standard- und semantischen Typen sind standardmäßig in die Anwendung integriert.

      • Für die Standardtypen werden je nach ausgewähltem Typ zusätzliche Felder angezeigt. Diese Felder sind optional und ermöglichen Ihnen die Definition bestimmter Constraints für das einzustellende Attribut, z. B. Mindest- und/oder Höchstlänge oder Vergleichsmuster für die Validierung des Attributs.

        Um sicherzustellen, dass der gesamte Wert Ihrem Validierungsmuster entspricht, hat es sich bewährt, das Validierungsmuster durch die Zeichen ^ und $ einzugrenzen.

        Einige Beispiele:
        • [A-Z] entspricht A und ABC.
        • ^[A-Z]$ entspricht A, jedoch nicht ABC.

        Für die Spalten Date (Datum) und Timestamp (Zeitstempel) können Sie auf eine Datums- und Uhrzeitauswahl zugreifen, über die Sie das Datum und die Uhrzeit automatisch im richtigen Format einstellen können.

      • Für die Verwaltung der semantischen Typen können Sie Talend Dictionary Service heranziehen. Die Verfügbarkeit dieses Dienstes ist jedoch von Ihrer Lizenz abhängig.
  4. Sie können auch die Option Allow empty values (Leere Werte zulassen) deaktivieren, damit keine leeren Felder hochgeladen werden. Standardmäßig ist diese Option aktiviert.
  5. Klicken Sie auf Add attribute (Attribut hinzufügen) und wiederholen Sie die obigen Schritte, um alle Spalten zu erstellen, die Sie im Datenmodell benötigen.
    Die für die Kampagne Site deduplication (Standort-Deduplizierung) definierten und in diesem Beispiel verwendeten Spalten enthalten Informationen zu Kinderbildungs- und -betreuungseinrichtungen in Chicago.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!