Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Erkennen semantischer Typen

Die Datenerkennung berechnet die Anzahl der Werte, die jedem semantischen Typ entsprechen, und weist bei einem Ergebnis über 40 % dann den betreffenden semantischen Typ der Spalte zu.

Um den Prozentsatz für jeden semantischen Typ anzuzeigen, klicken Sie in der Sample-Ansicht Ihres Datensatzes auf das Symbol menu (Menü).

Für die Adresszeile angezeigter semantischer Typ

Diese Funktion ist auch in der Hierarchieansicht (Hierarchy) verfügbar.

Wie wird der Prozentsatz berechnet?

Der Prozentsatz ist die Summe aus zwei Prozentsätzen:
  • Ein Prozentsatz entspricht der Anzahl der Werte, die mit dem semantischen Typ übereinstimmen. Max. zugewiesener Wert: 100 %.

    Um zu bestimmen, ob ein Wert einem semantischen Typ entspricht, greift die Datenerkennung auf den Typ des semantischen Typs zurück:

    • Wörterbuch: Entspricht der Wert einem Wert aus dem Wörterbuch? Satzzeichen, Groß-/Kleinschreibung, Leerzeichen und Akzente werden ignoriert.
    • Regular expression (Regulärer Ausdruck): Entspricht der Wert dem regulären Ausdruck?
    • Compound (Zusammengesetzter Wert): Wird der Wert in mindestens einem untergeordneten Element erkannt?
      Ein zusammengesetzter Typ entspricht einer Gruppe vorhandener semantischer Typen, die als untergeordnete Elemente bezeichnet werden.

    Bei einer positiven Antwort wird der Wert als gültig eingestuft.

  • Der andere Prozentsatz verweist auf die Ähnlichkeit zwischen Spaltenname und Name des semantischen Typs. Max. zugewiesener Wert: 10 %.
    Für den Vergleich der Namen:
    • Wird der Levenshtein-Algorithmus verwendet. Wird die Mindestanzahl an Bearbeitungen (Einfügen, Löschen oder Ersetzen) berechnet, die für die Transformation einer Zeichenfolge in eine andere erforderlich ist.
    • Werden Groß-/Kleinschreibung und Akzente ignoriert.
    • Wenn die Zeichenfolgen Leerzeichen enthalten, wird die Wortreihenfolge ignoriert. Beispiel: US Phone und Phone US werden als identisch eingestuft.
    Der maximale Prozentsatz ist 100 %. Wenn alle Werte einem semantischen Typ entsprechen und der Spaltenname mit dem Namen des semantischen Typs übereinstimmt, ist das Ergebnis ebenfalls 100 %.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!