ジョブを作成し、入力テキストをCoNLL形式のトークンに分割する - 7.2

Natural Language Processing

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 自然言語処理
データガバナンス > サードパーティーシステム > 自然言語処理
データクオリティとプレパレーション > サードパーティーシステム > 自然言語処理
このジョブでは、テキストサンプルをXML形式に分割するためにtNLPPreprocessingを使用します。次に、tNormalizeを使用してトークンをCoNLL形式に変換します。

手順

  1. 次のコンポーネントを[Palette] (パレット)からデザインワークスペースにドロップします: tXMLFileInputtNLPPreprocessingtFilterColumnstNormalizetFileOutputDelimited
  2. [Row] (行) > [Main] (メイン)接続を使用してコンポーネントを接続します。

タスクの結果