Accéder au contenu principal

tTransliterate

Ce composant convertit des chaînes de caractères de différentes langues du monde en un jeu de caractères standard (Universal Coded Character Set, UCS).

Cette conversion est une opération phonétique, dans laquelle le composant tTransliterate essaye de créer en UCS un équivalent de la chaîne de caractères originale, en se basant sur le son que cette chaîne représente.

Le tTransliterate encode des textes rédigés dans différents systèmes d'écriture du monde en caractères lisibles, en se basant sur le répertoire du standard Unicode. Vous pouvez reconnaître et interpréter des mots de différentes langues plus facilement que si les caractères étaient toujours dans leur écriture originale. Pour plus d'informations concernant Unicode et le standard Unicode, consultez Unicode et Unicode Standard (en anglais).

En mode local, les versions 2.4.0 et supérieures d'Apache Spark sont supportées.

Ce composant n'est pas intégré par défaut à votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !