Accéder au contenu principal

Composants de standardisation de texte

tJapaneseNumberNormalize Ce composant normalise des nombres japonais (kansūji) vers des nombres arabes.
tJapaneseTokenize Ce composant segmente du texte japonais.
tJapaneseTransliterate Ce composant convertit des données textuelles en japonais vers des caractères kana et caractères de l'alphabet latin.
tStem Ce composant permet de standardiser des données dans des colonnes avant d'effectuer des correspondances.
tTransliterate Ce composant convertit des chaînes de caractères de différentes langues du monde en un jeu de caractères standard (Universal Coded Character Set, UCS).

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.