Accéder au contenu principal

Segmentation de texte en japonais

Ce scénario s'applique uniquement à Talend Data Management Platform, Talend Big Data Platform, Talend Real-Time Big Data Platform, Talend MDM Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Avec le composant tJapaneseTokenize, vous pouvez segmenter du texte en japonais.

Pour reproduire l'exemple décrit ci-après, téléchargez le fichier tJapaneseTokenize_standard_scenario.zip.

Le fichier tJapaneseTokenize_standard_scenario.zip comprend :
  • le fichier texte inputJapaneseText.txt contenant du texte en japonais, la transcription et la traduction en anglais ;
  • le fichier tJapaneseTokenizeJob.zip contenant le Job.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !