Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Auffinden ähnlicher Werte

Wenn Sie ähnlich aussehenden Text auffinden und ausfiltern möchten, um beispielsweise Tippfehler zu berichtigen, können Sie die Funktion Match Similar Text (Ähnlichen Text suchen) heranziehen.

Diese Funktion erstellt eine neue Spalte mit dem Wert true bei Übereinstimmung mit dem Muster und bei Nichtübereinstimmung mit false.

Prozedur

  1. Wählen Sie die Textspalte aus, in der ähnlicher Text ausfindig gemacht werden soll.
  2. Geben Sie im Bereich Functions (Funktionen) Match Similar Text (Ähnlichen Text suchen) ein und klicken Sie dann auf das Ergebnis, um die Optionen für die entsprechende Funktion zu öffnen.
  3. Füllen Sie die Optionen gemäß Ihren Anforderungen aus.

    Das Feld Reference (Referenz) entspricht dem von Ihnen eingegebenen Text, das Feld Fuzziness verweist auf die Anzahl der Zeichen, die der Reference (Referenz) hinzugefügt oder davon entfernen werden können bzw. die sich davon unterscheiden. Diese Anzahl wird als Levenshtein-Distanz bezeichnet.

    Beachten Sie, dass im Feld Reference (Referenz) zwischen Groß- und Kleinschreibung unterschieden wird. In diesem Beispiel wird als Reference (Referenz)-Text new (neu) und als Levenshtein-Distanz (Fuzziness) der Wert 1 verwendet.

    Folglich würden bei Anwendung der Funktion Wörter wie „few“, „now“, „net“ oder „news“, jedoch nicht „bow“, „nap“ oder „led“ als Übereinstimmung zurückgegeben.

  4. Klicken Sie auf die Schaltfläche Submit (Senden), um die Funktion mit den ausgewählten Optionen anzuwenden.

Ergebnisse

Dabei wird eine neue Spalte mit dem Wert true bei Übereinstimmung mit dem Muster und bei Nichtübereinstimmung mit false erstellt.

Weitere Informationen zur Levenshtein-Distanz finden Sie unter Levenshtein-Distanz in Wikipedia.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!