Modèles basés sur les mots - 7.3

Guide d'utilisation de Talend Data Stewardship

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Content
Administration et monitoring > Gestion des utilisateurs
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Gestion des tâches
Qualité et préparation de données > Gestion des types sémantiques
Last publication date
2023-10-03
Talend Data Stewardship effectue un profiling basé sur les mots et calcule les modèles basés sur les mots dans les données chargées dans n'importe quelle campagne. Vous pouvez utiliser ces modèles pour filtrer les tâches selon leur contenu et la structure des données, avant d'attribuer ou résoudre les tâches.

Les modèles basés sur les mots sont sensibles à la casse et sont calculés uniquement pour des champs non numériques, comme du texte, des booléens et des types sémantiques. Le tableau suivant liste les modèles basés sur les mots et leur description.

Modèle Description
[Word] Mot commençant par un caractère en majuscule suivi de caractères en minuscules
[WORD] Mot composé de caractères en majuscules
[word] Mot composé de caractères en minuscules
[Char] Unique caractère en majuscule
[char] Unique caractère en minuscule
[Ideogram] Un des idéogrammes unifiés CJC
[IdeogramSeq] Séquence d'idéogrammes
[hiraSeq] Séquence de caractères japonais Hiragana
[kataSeq] Séquence de caractères japonais Katakana
[hangulSeq] Séquence de caractères coréens Hangul
[digit] Un des chiffres arabes : 0,1,2,3,4,5,6,7,8,9
[number] Séquence de chiffres

Les exemples suivants illustrent comment certains enregistrements seront interprétés dans Talend Data Stewardship.

String Pattern
A character is NOT a Word [Char] [word] [word] [WORD] [char] [Word]
someWordsINwORDS [word][Word][WORD][char][WORD]
Example123@domain.com [Word][number]@[word].[word]
anotherExample8@domain.com [word][Word][digit]@[word].[word]
袁 花木蘭88 [Ideogram] [IdeogramSeq][number]
Latin2中文 [Word][digit][IdeogramSeq]
Latin3フランス [Word][digit][kataSeq]
Latin4とうきょう [Word][digit][hiraSeq]
Latin5나는 한국 사람입니다 [Word][digit][hangulSeq]