Modèles basés sur les caractères - Cloud

Guide utilisateur de Talend Cloud Data Stewardship

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Administration et monitoring > Gestion des utilisateurs
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Gestion des tâches
EnrichPlatform
Talend Data Stewardship
Talend Cloud Data Stewardship effectue un profiling basé sur les caractères et calcule la répartition des modèles basés sur les caractères dans les données chargées dans n'importe quelle campagne.

Les caractères latins, comme les caractères asiatiques, divisés en hiragana, katakana, kanji et hangul, sont représentés par les modèles suivants :

   
Latin numbers 9 remplace tous les chiffres ASCII.
Latin lowercase letters a remplace tous les caractères latins ASCII.
Latin uppercase letters A remplace tous les caractères latins en majuscule.
Hiragana H remplace tous les caractères Hiragana
Katakana K remplace tous les caractères Katakana (majuscules)
Kanji C remplace des caractères chinois.
Hangul G remplace des caractères Hangeul.
Katakana K remplace tous les caractères Katakana (majuscules)