Zu Hauptinhalt springen

Erweitern der semantischen Typen für Data Stewardship

Talend Dictionary Service speichert die semantischen Kategorien, die in verschiedenen Talend-Produkten wie z. B. Talend Cloud Data Stewardship zur Anwendung kommen. Sie können diese semantischen Typen mit Ihren persönlichen Kategorien anreichen, damit sind alle von Ihnen vorgenommenen Änderungen sofort verfügbar. Die Verfügbarkeit von Talend Dictionary Service ist von Ihrer Lizenz abhängig.
InformationshinweisAnmerkung: Sie können Inhalt bis 10 MB pro Mandant in Talend Dictionary Service hochladen.
Um die Interaktion zwischen Talend Dictionary Service und Talend Cloud Data Stewardship zu ermöglichen, müssen Sie folgende Voraussetzungen erfüllen:
  • Sie verfügen über eine Plattformlizenz.
  • Ihr Benutzer von Talend Cloud muss neben Rollen von Talend Cloud Data Stewardship über die in Talend Cloud Data Stewardship zugewiesene Rolle Semantic types manager (Semantische Typen - Verwaltung) der Anwendung Dictionary Service verfügen.
InformationshinweisAnmerkung: Wenn Sie eine Testversion von Talend Cloud Data Stewardship verwenden, ist die Verwaltung semantischer Typen nicht verfügbar.

Wenn Kampagnenverantwortliche die Struktur der in einer Kampagne zu verwaltenden Daten definieren, können Sie in einer vordefinierten Liste den semantischen Typ für jedes Attribut auswählen. Wenn sie Daten in Talend Cloud Data Stewardship laden, wird eine interne Validierung des Schematyps durchgeführt und die Daten werden entsprechend als gültig oder ungültig angezeigt.

Gültige und ungültige Daten in einer Kampagne

Ein Beispiel: Die standardmäßig in der Anwendung enthaltene Liste für Länder enthält nicht die Einträge Republic of Angola (Volksrepublik Angola) und UK (Vereinigtes Königreich). Demzufolge werden diese Einträge beim Laden in Talend Cloud Data Stewardship als ungültige Ländernamen eingestuft.

Sie können jedoch noch weitergehen und Ihre eigenen semantischen Typen erstellen oder die bereits vorhandenen aktualisieren bzw. löschen, sodass die Nutzererfahrung mit Talend Cloud Data Stewardship gezielt dem Image Ihes Unternehmens entspricht. Alle diese Verwaltungsvorgänge können Sie auf einer integrierten Benutzeroberfläche durchführen.

Bei der Erstellung semantischer Typen können Sie bestimmen, ob diese zur Datenvalidierung oder zur Datenerkennung verwendet werden sollen.
  • Bei der Datenvalidierung werden die Daten mit den semantischen Typen verglichen und als gültig oder ungültig markiert.
  • Bei der Datenerkennung werden die semantischen Kategorien geprüft und die komplexen semantischen Beziehungen in den von Ihnen analysierten Daten abgefragt. Anschließend werden alle Übereinstimmungen als Ergebnis ausgegeben, um die relevantesten Konzepte auszuweisen.

Talend Cloud Data Stewardship verwendet die semantischen Typen nur zur Validierung, da auf der Seite der Anwendung keine Datenerkennung durchgeführt wird.

Die semantischen Typen sind auf dem Server in verschiedene Kategorien untergliedert:
  • Den Typ Dictionary (Wörterbuch), der auf eine geschlossenen Liste von Werten basiert.
  • Den Typ Regular expression (Regulärer Vergleich), der Ihre Daten mit einem im Vorfeld ausgewählten regulären Ausdruck vergleicht.
  • Den Typ Compound (Zusammengesetzt), der Ihre Daten mit verschiedenen, im Compound-Typ referenzierten semantischen Typen vergleicht.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!