Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Aktualisieren vorhandener semantischer Typen

Sie können einen vorhandenen semantischen Typ in Talend Dictionary Service bearbeiten, um festzulegen, wie Ihre Daten in der Sample-Ansicht der Anwendung validiert werden.

Vordefinierte semantische Typen basieren auf Standardwerten, Sie müssen diese Werte jedoch unter Umständen anpassen, damit Sie Ihren eigenen Daten entsprechen. Einige Daten, die Ihrer Meinung nach einer vordefinierten Kategorie entsprechen sollten, werden ggf. als ungültig eingestuft.

Ein Beispiel: Sie verfügen über einen Datensatz mit einer Liste von Kunden mit deren E-Mailadresse, Geburtsdatum und Wohnland. Wie Sie feststellen können, werden alle Einträge für America (Amerika) als ungültig eingestuft. Zwar handelt es sich tatsächlich nicht um einen gültigen Ländernamen, aber es ist ein Wert, den Ihr Unternehmen verwendet und den Sie deshalb als gültigen Wert einstufen möchten.

Das Problem ist, dass America (Amerika) keinem der erwarteten Werte für den semantischen Typ country (Land) in Talend Dictionary Service entspricht. Ein gültiger Eintrag in diesem Fall wäre United States (USA) oder United States of America (Vereinigte Staaten von Amerika).

Um dieses Problem in Zukunft zu vermeiden, müssen Sie den semantischen Typ country (Land) in Talend Dictionary Service aktualisieren und America (Amerika) zur Liste der gültigen Einträge hinzufügen. Die Änderung ist dann automatisch in Talend Cloud Data Inventory und den anderen Cloud-Anwendungen verfügbar.

Prozedur

  1. Öffnen Sie über den linken Seitenbereich der Homepage die Ansicht Semantic type (Semantischer Typ).
  2. Klicken Sie in der Liste der vorhandenen semantischen Typen auf den Typ Country (Land), um ihn zu öffnen.
    In diesem Fenster können alle Parameter des semantischen Typs geändert werden, einschließlich der Liste der zur Erkennung oder Validierung von Daten verwendeten Einträge.
  3. Setzen Sie den Mauszeiger in der Liste Values (Werte) auf den Eintrag United States (USA) und klicken Sie dann auf das rechts daneben angezeigte Stiftsymbol.
  4. Geben Sie direkt hinter United States (USA), durch ein Komma abgesetzt, den neuen Wert America (Amerika) ein.
  5. Klicken Sie auf das Prüfsymbol, um die Änderung zu validieren.
    Alle durch ein Komma voneinander abgesetzten Werte in derselben Zeile werden als Synonyme gehandhabt. Demzufolge wird America (Amerika) jetzt als gültiger Wert für den semantischen Typ country (Land) eingestuft.
  6. Klicken Sie auf Save and publish (Speichern und veröffentlichen), um die Änderung in Talend Dictionary Service anzuwenden und für alle Benutzer verfügbar zu machen.
    Die Änderung eines semantischen Typs ist in Talend Cloud Data Inventory für jeden von Ihnen neu erstellten Datensatz sofort verfügbar. Für die bereits vorhandenen Datensätze müssen Sie das Sample aktualisieren, damit die Qualität mit dem neuen Wert neu berechnet wird.
  7. Kehren Sie zu Ihrem Datensatz mit der Spalte der kundenspezifischen Länder zurück.
  8. Klicken Sie auf die Schaltfläche Refresh sample (Sample aktualisieren).
    Position der Schaltfläche zur Aktualisierung („Refresh“) in der Datensatzübersicht

Ergebnisse

Der semantische Typ country (Land) wurde manuell aktualisiert und unterstützt jetzt einen neuen Wert. Wie Sie sehen, gibt die Qualitätsleiste unter der Spaltenüberschrift an, dass keine ungültigen Werte mehr vorhanden sind.

Von nun an wird bei der Arbeit mit Daten, die dem semantischen Typ country (Land) entsprechen, America (Amerika) als gültiger Wert eingestuft.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!