Entfernen semantischer Typen - Cloud

Nutzungshandbuch für Talend Cloud Data Inventory

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration und Überwachung > Verwaltung von Verbindungen
Data Governance
Datenqualität und Datenaufbereitung > Anreicherung von Daten
Datenqualität und Datenaufbereitung > Identifizierung von Daten
Datenqualität und Datenaufbereitung > Verwaltung von Datensätzen
Last publication date
2024-03-01

Sie können einen semantischen Typ in Talend Dictionary Service löschen, um ihn aus der Liste der erkannten Datentypen in den Talend Cloud-Anwendungen zu entfernen.

Die Vielfalt der standardmäßig vorhandenen semantischen Typen ist unter Umständen nicht für Ihren Geschäftskontext geeignet. So kann beispielsweise eine 5-stellige Zahl sowohl als US-amerikanische als auch als französische oder deutsche Postleitzahl eingestuft werden, da für alle dasselbe Format verwendet wird.

Ein Beispiel: Sie arbeiten für eine US-amerikanische Firma, in der Sie ausschließlich für die Daten von US-amerikanischen Kunden zuständig sind, u. a. deren Postleitzahlen. Sie möchten in der Liste der erkannten semantischen Typen nur die US-amerikanischen PLZ beibehalten.

In diesem Beispiel kann die Spalte ZIP (PLZ) des Datensatzes mindestens vier Typen zugeordnet werden.

Mithilfe von Talend Dictionary Service entfernen Sie ganz einfach die anderen semantischen Typen, die dem 5-stelligen Format entsprechen, und behalten lediglich US Postal Code (US-amerikanische Postleitzahl) bei. Die vorgenommene Änderung wird dann direkt übertragen, d. h. ab jetzt werden alle Postleitzahlen zur Validierung nur mit dem semantischen Typ US Postal Code (US-amerikanische Postleitzahl) verglichen.

Prozedur

  1. Öffnen Sie über den linken Seitenbereich der Homepage die Ansicht Semantic type (Semantischer Typ).
  2. Suchen Sie in der Liste der vorhandenen semantischen Typen nach dem Typ FR Postal Code (Französische Postleitzahl).
  3. Um diesen semantischen Typ zu löschen, zeigen Sie mit der Maus darauf und klicken Sie dann auf das rechts daneben angezeigte Papierkorb-Symbol.
  4. Wiederholen Sie die letzten zwei Schritte, um die semantischen Typen FR Insee Code (Französischer INSEE-Code) und DE Postal Code (Deutsche Postleitzahl) zu löschen.

Ergebnisse

Sie haben jetzt die anderen semantischen Typen gelöscht, die dem 5-stelligen Zahlenformat entsprechen. Wenn Sie jetzt neue Datensätze hinzufügen, wird für die Spalten mit Postleitzahlen lediglich der semantische Typ US Postal Code (US-amerikanische Postleitzahl) vorgeschlagen.
Anmerkung: Wenn Sie einen semantischen Typ entfernen, der in einem oder mehreren Datensätzen verwendet wird, werden die betroffenen Spalten auf die Kategorie text zurückgesetzt.