tTransliterate - 6.4

Text standardization

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
EnrichPlatform
Studio Talend

Ce composant convertit des chaînes de caractères de différentes langues du monde en un jeu de caractères standard (Universal Coded Character Set, UCS).

Cette conversion est une opération phonétique, dans laquelle le composant tTransliterate essaye de créer en UCS un équivalent de la chaîne de caractères originale, en se basant sur le son que cette chaîne représente.

Le tTransliterate encode des textes rédigés dans différents systèmes d'écriture du monde en caractères lisibles, en se basant sur le répertoire du standard Unicode. Vous pouvez reconnaître et interpréter des mots de différentes langues plus facilement que si les caractères étaient toujours dans leur écriture originale.. Pour plus d'informations concernant Unicode et le standard Unicode, consultez Unicode et Unicode Standard (en anglais).

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.