Ändern des semantischen Typs einer Beliebtheitsspalte - Cloud

Einführungshandbuch für Talend Cloud Data Inventory

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration und Überwachung > Verwaltung von Verbindungen
Data Governance
Datenqualität und Datenaufbereitung > Anreicherung von Daten
Datenqualität und Datenaufbereitung > Identifizierung von Daten
Last publication date
2024-03-26

Der semantische Typ entspricht der Kategorie (Namen, E-Mails, Telefonnummern usw.) der Daten. Wenn der für eine Spalte erkannte semantische Typ nicht der gewünschte ist, können Sie ihn jederzeit manuell basierend auf Ihrer Einschätzung in einen der vordefinierten Typen ändern.

Im Fall des Datensatzes movies_gsg illustriert die Anzeige des Samples, dass den meisten Spalten ein Typ zugewiesen wurde, der den tatsächlichen Daten entspricht, wie z. B. String (Zeichenfolge) für Titel, Date (Datum) für Versionsdaten oder Language code iso2 (Sprachcode ISO2) für die Originalsprache. Sie werden jedoch feststellen, dass die Spalte popularity (Beliebtheit) als geographical coordinates (Geografische Koordinaten) markiert ist, was in diesem speziellen Kontext nicht korrekt ist. Die Formatierung der Daten entspricht der möglichen Schreibweise der Koordinaten. Sie werden sie jedoch so aktualisieren, dass der Typ dem tatsächlichen Inhalt der Spalte besser entspricht.

Prozedur

  1. Klicken Sie in die Überschrift der Spalte popularity (Beliebtheit).
    Wenn Sie auf das Symbol Edit (Bearbeiten) neben dem semantischen Typ im rechten Fensterbereich klicken, werden der am besten übereinstimmende Typ, in diesem Fall geographical coordinates(Geografische Koordinaten), sowie eher Standardtypen wie z. B. Text, Integer (Ganzzahl), Decimal (Dezimalwert) oder Boolean (Boolescher Wert) angezeigt. Der geografische Koordinatentyp wurde aufgrund der 99% -Kompatibilität automatisch zugewiesen, die fehlenden 1 % haben den einzigen ungültigen Wert der Spalte zur Folge.
  2. Wählen Sie in der Liste der verfügbaren Typen den Typ Decimal (Dezimalwert) aus.
  3. Wiederholen Sie diese Schritte, um die Spalte runtime (Laufzeit) ebenfalls in den geeigneteren Typ Decimal (Dezimalwert) zu ändern.
  4. Klicken Sie auf Apply 2 changes (2 Änderungen anwenden).

Ergebnisse

Sie haben den semantischen Typ der Spalten popularity (Beliebtheit) und runtime (Laufzeit) geändert. Und da der Typ Decimal (Dezimalwert) zu 100 % mit den Daten in der Spalte popularity (Beliebtheit) übereinstimmt, wird die Qualitätsleiste in der Spaltenüberschrift nicht mehr orange angezeigt.