Modèles basés sur les caractères - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation
Talend Data Preparation vous permet d'analyser la répartition dans vos données des modèles basés sur les caractères.

Les caractères latins, comme les caractères asiatiques, divisés en hiragana, katakana, kanji et hangul, sont représentés par les modèles suivants :

Caractère Modèle
Chiffres latins 9 remplace tous les chiffres ASCII.
Latin lowercase letters a remplace tous les caractères latins ASCII.
Latin uppercase letters A remplace tous les caractères latins en majuscule.
Hiragana H remplace tous les caractères Hiragana
Katakana K remplace tous les caractères Katakana (majuscules)
Kanji C remplace des caractères chinois.
Hangul G remplace des caractères Hangeul.
Katakana K remplace tous les caractères Katakana (majuscules)