Créer un Job afin de diviser un texte en termes individuels au format CoNLL - 6.5

Natural Language Processing

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Traitement automatique du langage naturel
Gouvernance de données > Systèmes tiers > Traitement automatique du langage naturel
Qualité et préparation de données > Systèmes tiers > Traitement automatique du langage naturel
EnrichPlatform
Studio Talend
Ce Job utilise le tNLPPreprocessing afin de diviser un échantillon de texte au format XML en termes individuels. Ensuite, ces termes individuels sont convertis au format CoNLL à l'aide du tNormalize.

Procédure

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tXMLFileInput, un tNLPPreprocessing, un tFilterColumns, un tNormalize et un tFileOutputDelimited.
  2. Reliez les composants à l'aide de liens Row > Main.

Résultats