Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Entfernen semantischer Typen

Sie können einen semantischen Typ in Talend Dictionary Service löschen, um ihn aus der Liste der erkannten Datentypen in den Talend Data Preparation-Anwendungen zu entfernen.

Eine Vielzahl der standardmäßig in Talend Data Preparation vorhandenen semantischen Typen sind unter Umständen Ihrem Geschäftskontext nicht angepasst. Wenn beispielsweise eine 5-stellige Zahl sowohl als US-amerikanische als auch als französische oder deutsche Postleitzahl eingestuft wird, da für alle dasselbe Format verwendet wird.

Ein Beispiel: Sie arbeiten für eine US-amerikanische Firma und Sie allein verwalten die Daten der US-amerikanischen Kunden, einschließlich der Postleitzahlen. Sie möchten in der Liste der erkannten semantischen Typen nur die US-amerikanischen PLZ beibehalten.

In diesem Beispiel kann die Spalte ZIP (PLZ) des Datensatzes mindestens vier Typen zugeordnet werden.

Geöffnete semantische Typen für Spalten mit Postleitzahlen

Mithilfe von Talend Dictionary Service entfernen Sie ganz einfach die anderen semantischen Typen, die dem 5-stelligen Format entsprechen, und behalten lediglich US Postal Code (US-amerikanische Postleitzahl) bei. Die vorgenommene Änderung wird dann direkt in Talend Data Preparation übertragen, d. h. ab jetzt werden alle Postleitzahlen zur Validierung nur mit dem semantischen Typ US Postal Code (US-amerikanische Postleitzahl) verglichen.

Prozedur

  1. Öffnen Sie die Ansicht Semantic types (Semantische Typen) über den linken Fensterbereich der Homepage von Talend Data Preparation.
  2. Suchen Sie in der Liste der vorhandenen semantischen Typen nach dem Typ FR Postal Code (Französische Postleitzahl).
  3. Um diesen semantischen Typ zu löschen, zeigen Sie mit der Maus darauf und klicken Sie dann auf das rechts daneben angezeigte Papierkorb-Symbol.
  4. Wiederholen Sie die letzten zwei Schritte, um die semantischen Typen FR Insee Code (Französischer INSEE-Code) und DE Postal Code (Deutsche Postleitzahl) zu löschen.

Ergebnisse

Sie haben jetzt die anderen semantischen Typen gelöscht, die dem 5-stelligen Zahlenformat entsprechen. Wenn Sie jetzt neue Datensätze hinzufügen, wird für die Spalten mit Postleitzahlen lediglich der semantische Typ US Postal Code (US-amerikanische Postleitzahl) vorgeschlagen.

Wenn Sie einen semantischen Typ entfernen, der in einem oder mehreren Datensätzen verwendet wird, werden die betroffenen Spalten auf die Kategorie text zurückgesetzt.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!