Avant de commencer
Vous avez récupéré le fichier tJapaneseTokenize_standard_scenario.zip.
Procédure
-
Double-cliquez sur le tFileInputDelimited pour ouvrir sa vue Basic settings dans l'onglet Component.
- Dans le champ File name/Stream, saisissez le chemin vers le fichier contenant du texte en japonais à segmenter.
- Dans les champs Row Separator et Field Separator, définissez les caractères à utiliser comme séparateurs de lignes et de champs.
- Définissez le nombres de lignes dans les champs Header et Footer.
- Cliquez sur le bouton Edit schema pour définir les colonnes du jeu de données source, ainsi que leur type.
-
Cliquez sur le bouton [+] pour ajouter des colonnes au schéma.
Exemple
- Cliquez sur OK pour valider ces changements et acceptez la propagation demandée.
-
Dans l'onglet Advanced settings du composant tFileInputDelimited, sélectionnez l'encodage correspondant dans la liste Encoding.
Le fichier inputJapaneseText.txt est encodé en UTF-8.