Modèles basés sur les caractères - 7.2

Guide d'utilisation de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation
Talend Data Preparation vous permet d'analyser la répartition dans vos données des modèles basés sur les caractères.

Les caractères latins, comme les caractères asiatiques, divisés en hiragana, katakana, kanji et hangul, sont représentés par les modèles suivants :

Caractère Modèle
Chiffres latins 9 remplace tous les chiffres ASCII.
Latin lowercase letters a remplace tous les caractères latins ASCII.
Latin uppercase letters A remplace tous les caractères latins en majuscule.
Hiragana H remplace tous les caractères Hiragana
Katakana K remplace tous les caractères Katakana (majuscules)
Kanji C remplace des caractères chinois.
Hangul G remplace des caractères Hangeul.
Katakana K remplace tous les caractères Katakana (majuscules)