Modèles basés sur les mots

Talend Data Preparation vous permet d'analyser la répartition dans vos données des modèles basés sur les mots.

Les indicateurs de modèles basés sur les mots sont sensibles à la casse.

Liste des modèles de la zone de profiling
Pattern (Modèle)	Description
[Word]	Mot commençant par un caractère en majuscule suivi de caractères en minuscules
[WORD]	Mot composé de caractères en majuscules
[word]	Mot composé de caractères en minuscules
[Char]	Unique caractère en majuscule
[char]	Unique caractère en minuscule
[Ideogram]	Un des idéogrammes unifiés CJC
[IdeogramSeq]	Séquence d'idéogrammes
[hiraSeq]	Séquence de caractères japonais Hiragana
[kataSeq]	Séquence de caractères japonais Katakana
[hangulSeq]	Séquence de caractères coréens Hangul
[digit]	Un des chiffres arabes : 0,1,2,3,4,5,6,7,8,9
[number]	Séquence de chiffres

Exemples d'interprétation de certains enregistrements dans Talend Data Preparation
String	Modèle
A character is NOT a Word	[Char] [word] [word] [WORD] [char] [Word]
someWordsINwORDS	[word][Word][WORD][char][WORD]
Example123@domain.com	[Word][number]@[word].[word]
anotherExample8@domain.com	[word][Word][digit]@[word].[word]
袁花木蘭88	[Ideogram] [IdeogramSeq][number]
Latin2中文	[Word][digit][IdeogramSeq]
Latin3フランス	[Word][digit][kataSeq]
Latin4とうきょう	[Word][digit][hiraSeq]
Latin5나는 한국 사람입니다	[Word][digit][hangulSeq]

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !

Laissez vos commentaires ici