Wortbasierte Muster

Talend Data Preparation ermöglicht Ihnen die Analyse der Verteilung wortbasierter Muster in Ihren Daten.

Die Indikatoren für wortbasierte Muster unterscheiden zwischen Groß- und Kleinschreibung.

Liste der im Profiling-Bereich zu findenden Muster
Muster	Beschreibung
[Word]	Wort beginnend mit einem Großbuchstaben und bestehend aus Kleinbuchstaben
[WORD]	Wort mit Großbuchstaben
[word]	Word mit Kleinbuchstaben
[Char]	Einzelner Großbuchstabe
[char]	Einzelner Kleinbuchstabe
[Ideogram]	Eines der vereinheitlichten CJK-Ideogramme
[IdeogramSeq]	Ideogrammsequenz
[hiraSeq]	Sequenz aus japanischen Hiragana-Schriftzeichen
[kataSeq]	Sequenz aus japanischen Katakana-Schriftzeichen
[hangulSeq]	Sequenz aus koreanischen Hangul-Schriftzeichen
[digit]	Eine der arabischen Zahlen: 0,1,2,3,4,5,6,7,8,9
[number]	Sequenz aus Zahlen

Examples of how certain records would be interpreted in Talend Data Preparation
Zeichenfolge (String)	Muster
A character is NOT a Word	[Char] [word] [word] [WORD] [char] [Word]
someWordsINwORDS	[word][Word][WORD][char][WORD]
Example123@domain.com	[Word][number]@[word].[word]
anotherExample8@domain.com	[word][Word][digit]@[word].[word]
袁花木蘭88	[Ideogram] [IdeogramSeq][number]
Latin2中文	[Word][digit][IdeogramSeq]
Latin3フランス	[Word][digit][kataSeq]
Latin4とうきょう	[Word][digit][hiraSeq]
Latin5나는 한국 사람입니다	[Word][digit][hangulSeq]

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!

Geben Sie hier Ihr Feedback ab