Zu Hauptinhalt springen

Wortbasierte Muster

Talend Data Preparation ermöglicht Ihnen die Analyse der Verteilung wortbasierter Muster in Ihren Daten.
Die Indikatoren für wortbasierte Muster unterscheiden zwischen Groß- und Kleinschreibung.
Liste der im Profiling-Bereich zu findenden Muster
Muster Beschreibung
[Word] Wort beginnend mit einem Großbuchstaben und bestehend aus Kleinbuchstaben
[WORD] Wort mit Großbuchstaben
[word] Word mit Kleinbuchstaben
[Char] Einzelner Großbuchstabe
[char] Einzelner Kleinbuchstabe
[Ideogram] Eines der vereinheitlichten CJK-Ideogramme
[IdeogramSeq] Ideogrammsequenz
[hiraSeq] Sequenz aus japanischen Hiragana-Schriftzeichen
[kataSeq] Sequenz aus japanischen Katakana-Schriftzeichen
[hangulSeq] Sequenz aus koreanischen Hangul-Schriftzeichen
[digit] Eine der arabischen Zahlen: 0,1,2,3,4,5,6,7,8,9
[number] Sequenz aus Zahlen
Examples of how certain records would be interpreted in Talend Data Preparation
Zeichenfolge (String) Muster
A character is NOT a Word [Char] [word] [word] [WORD] [char] [Word]
someWordsINwORDS [word][Word][WORD][char][WORD]
Example123@domain.com [Word][number]@[word].[word]
anotherExample8@domain.com [word][Word][digit]@[word].[word]
袁 花木蘭88 [Ideogram] [IdeogramSeq][number]
Latin2中文 [Word][digit][IdeogramSeq]
Latin3フランス [Word][digit][kataSeq]
Latin4とうきょう [Word][digit][hiraSeq]
Latin5나는 한국 사람입니다 [Word][digit][hangulSeq]

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!