Ce Job utilise le tNLPPreprocessing afin de diviser un échantillon de texte au format XML en termes individuels. Ensuite, ces termes individuels sont convertis au format CoNLL à l'aide du tNormalize.
Procédure
- Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tXMLFileInput, un tNLPPreprocessing, un tFilterColumns, un tNormalize et un tFileOutputDelimited.
- Reliez les composants à l'aide de liens .