Hinzufügen neuer semantischer Compound-Typen - Cloud

Nutzungshandbuch für Talend Cloud Data Preparation

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration und Überwachung > Verwaltung von Verbindungen
Datenqualität und Datenaufbereitung > Bereinigung von Daten
Datenqualität und Datenaufbereitung > Verwaltung von Datensätzen
Last publication date
2024-04-18

Sie können einen zusammengesetzten semantischen Typ (Compound) erstellen, um andere semantische Typen zu gruppieren, die auf dem Talend Dictionary Service -Server veröffentlicht wurden, und ihn zur Liste der erkannten Datentypen in Talend Data Preparation hinzufügen.

Bei der Erstellung eines Compound-Typs können Sie alle semantischen Typen mischen, zudem kann ein semantischer Compound-Typ andere Compound-Typen referenzieren, vorausgesetzt, alle untergeordneten Typen wurden bereits veröffentlicht.

In diesem Beispiel müssen Sie eine Datei mit Informationen zu Kunden in den USA, im Vereinigten Königreich, in Deutschland und in Frankreich aufbereiten. Eine der Spalten in diesem Datensatz enthält die Postleitzahlen aus diesen verschiedenen Ländern, die folglich unterschiedliche Formate aufweisen. In diesem Fall wendet Talend Data Preparation den semantischen Typ an, der am ehesten den Werten in der Spalte entspricht, z. B. US Postal code (US-amerikanische Postleitzahl). Dadurch werden die restlichen Daten, d. h. die deutschen, französischen und britischen Postleitzahlen, als ungültig eingestuft.

Um Talend Data Preparation an diese Situation anzupassen, müssen Sie einen Compound-Typ erstellen, in dem die verschiedenen, zur Validierung der Postleitzahlen verwendeten semantischen Typen gruppiert werden.

Vorbereitungen

Alle semantischen Typen, die Sie im Compound-Typ gruppieren möchten, wurden veröffentlicht.

Prozedur

  1. Öffnen Sie die Ansicht Semantic types (Semantische Typen) über den linken Fensterbereich der Homepage von Talend Data Preparation und klicken Sie auf Add semantic type (Semantischen Typ hinzufügen).
  2. Geben Sie im Feld Name Postal code (Postleitzahl) ein.
  3. Geben Sie im Feld Description (Beschreibung) American, British, German and French postal codes (US-amerikanische, britische, deutsche und französische Postleitzahlen) ein.
  4. Wählen Sie in der Dropdown-Liste Type (Typ) den Typ Compound type (Zusammengesetzter Typ) aus.
  5. Der Schalter Use for validation (Für Validierung verwenden) muss aktiviert bleiben.

    Der Compound-Typ wird verwendet, um zu ermitteln, welche Werte einer Spalte als richtig oder falsch eingestuft werden, wenn er auf eine bestimmte Spalte angewendet wird. Das Ergebnis dieses Validierungsprozesses wird in der Qualitätsleiste jeder Spalte in Ihren Datensätzen angezeigt.

    Wenn Sie den Schalter in diesem Beispiel deaktivieren würden, würde der Compound-Typ lediglich zur Datenerkennung eingesetzt werden, und kein Wert würde als ungültig eingestuft werden.

  6. Wählen Sie in der Liste Children types (Untergeordnete Typen) die semantischen Typen aus, die Sie im Compound-Typ Postal code (Postleitzahl) gruppieren möchten.
    Für den Compound-Typ „Postal Code“ ausgewählte semantische Typen
  7. Klicken Sie auf Save and publish (Speichern und veröffentlichen), um den neuen Compound-Typ an den Talend Dictionary Service-Server zu senden und ihn den Benutzern von Talend Data Preparation zur Verfügung zu stellen.

    Durch Klicken auf Save as draft (Als Entwurf speichern) wird der semantische Typ in Talend Dictionary Service gespeichert, jedoch nicht an die Talend-Webanwendungen übertragen. Dadurch können Sie bestimmen, wann der semantische Typ öffentlich gemacht werden soll.

    Der Typ Postal code (Postleitzahl) ist jetzt in der Liste der semantischen Typen mit dem Status Published (Veröffentlicht) verfügbar.

    Typ „Postal Code“ veröffentlicht („Published“)

    Die Änderung von semantischen Typen wird für jeden neuen, von Ihnen importierten Datensatz direkt in Talend Data Preparation wirksam. Für bereits bestehende Datensätze müssen Sie den Spaltentyp manuell ändern bzw. den Datensatz neu importieren.

  8. Kehren Sie zu Ihrem Datensatz mit den Postleitzahlen aus verschiedenen Ländern zurück.
  9. Klicken Sie auf das Menüsymbol in der Überschrift der Spalte mit den Postleitzahlen und wählen Sie this column is a... (Diese Spalte weist folgenden Typ auf:) > Postal code (Postleitzahl) aus.

Ergebnisse

Ihre Daten werden jetzt dem von Ihnen in Talend Dictionary Service manuell erstellten Compound-Typ Postal code (Postleitzahl) zugeordnet. Ab jetzt wird neuen Datensätzen mit Postleitzahlen beim Import automatisch der zutreffende Typ zugeordnet.