Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Aktualisieren vorhandener semantischer Typen

Sie können einen vorhandenen semantischen Typ in Talend Dictionary Service bearbeiten, um zu bestimmen, wie Ihre Daten in Talend Data Preparation validiert werden.

Vordefinierte semantische Typen in Talend Data Preparation basieren auf Standardwerten, Sie müssen diese Werte jedoch unter Umständen anpassen, damit Sie Ihren eigenen Daten entsprechen. Einige Daten, die Ihrer Meinung nach einer vordefinierten Kategorie entsprechen sollten, werden ggf. als ungültig eingestuft.

Ein Beispiel: Sie verfügen über einen Datensatz mit einer Liste von Kunden mit deren E-Mailadresse, Geburtsdatum und Wohnland. Wie Sie feststellen können, werden alle Einträge für America (Amerika) als ungültig eingestuft. Zwar handelt es sich tatsächlich nicht um einen gültigen Ländernamen, aber es ist ein Wert, den Ihr Unternehmen verwendet und den Sie deshalb gern als gültigen Wert einstufen würden.

Datensatz der Kundendaten mit ungültigen Werten

Das Problem ist, dass America (Amerika) keinem der erwarteten Werte für den semantischen Typ country (Land) in Talend Data Preparation entspricht. Ein gültiger Eintrag in diesem Fall wäre United States (USA) oder United States of America (Vereinigte Staaten von Amerika).

Um dieses Problem in Zukunft zu vermeiden, müssen Sie den semantischen Typ country (Land) in Talend Dictionary Service aktualisieren und America (Amerika) zur Liste der gültigen Einträge hinzufügen. Die Änderung ist automatisch in Talend Data Preparation verfügbar.

Prozedur

  1. Öffnen Sie die Ansicht Semantic types (Semantische Typen) über den linken Fensterbereich der Homepage von Talend Data Preparation.
  2. Klicken Sie in der Liste der vorhandenen semantischen Typen auf den Typ Country (Land), um ihn zu öffnen.
    In diesem Fenster können alle Parameter des semantischen Typs geändert werden, einschließlich der Liste der zur Erkennung oder Validierung von Daten verwendeten Einträge.
  3. Setzen Sie den Mauszeiger in der Liste values (Werte) auf den Eintrag United States (USA) und klicken Sie dann auf das rechts daneben angezeigte Stiftsymbol.
  4. Geben Sie direkt hinter United States (USA), durch ein Komma abgesetzt, den neuen Wert America (Amerika) ein.
  5. Klicken Sie auf das Prüfsymbol, um die Änderung zu validieren.

    Alle durch ein Komma voneinander abgesetzten Werte in derselben Zeile werden als Synonyme gehandhabt. Demzufolge wird America (Amerika) jetzt als gültiger Wert für den semantischen Typ country (Land) eingestuft.

  6. Klicken Sie auf Save and publish (Speichern und veröffentlichen) , um die Änderung in Talend Dictionary Service anzuwenden und für alle Benutzer von Talend Data Preparation verfügbar zu machen.

    Die Änderung von semantischen Typen wird für jeden neuen, von Ihnen importierten Datensatz direkt in Talend Data Preparation wirksam. Für bereits bestehende Datensätze müssen Sie die Spalte duplizieren bzw. den Datensatz neu importieren.

  7. Kehren Sie zu Ihrem Datensatz mit der Spalte der kundenspezifischen Länder zurück.
  8. Duplizieren Sie die Spalte mit dem angewendeten aktualisierten semantischen Typ, in diesem Fall Country (Land).

    Die Qualitätsleiste unter der Spaltenüberschrift gibt an, dass keine ungültigen Werte mehr vorhanden sind.

    Datensatz der Kundendaten mit gültigen Werten

Ergebnisse

Der semantische Typ Country (Land) wurde manuell aktualisiert, um den neuen Wert zu unterstützen.

Von nun an wird bei der Arbeit mit Daten, die dem semantischen Typ country (Land) entsprechen, America (Amerika) als gültiger Wert eingestuft.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!