tTransliterate - Cloud - 8.0

Standardisation de texte

Version
Cloud
8.0
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Last publication date
2023-09-14

Ce composant convertit des chaînes de caractères de différentes langues du monde en un jeu de caractères standard (Universal Coded Character Set, UCS).

Cette conversion est une opération phonétique, dans laquelle le composant tTransliterate essaye de créer en UCS un équivalent de la chaîne de caractères originale, en se basant sur le son que cette chaîne représente.

Le tTransliterate encode des textes rédigés dans différents systèmes d'écriture du monde en caractères lisibles, en se basant sur le répertoire du standard Unicode. Vous pouvez reconnaître et interpréter des mots de différentes langues plus facilement que si les caractères étaient toujours dans leur écriture originale. Pour plus d'informations concernant Unicode et le standard Unicode, consultez Unicode et Unicode Standard (en anglais).

En mode local, les versions 2.4.0 et supérieures d'Apache Spark sont supportées.

Ce composant n'est pas intégré par défaut à votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.

Pour plus de technologies supportées par Talend, consultez Composants Talend.