tNLPPreprocessing - 7.2

Natural Language Processing

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 自然言語処理
データガバナンス > サードパーティーシステム > 自然言語処理
データクオリティとプレパレーション > サードパーティーシステム > 自然言語処理

テキストサンプルのプレパレーションを行い、複数のトークンに分割します。トークンは、単語、数字、または句読点の場合があります。

tNLPPreprocessingは、入力テキスト用のすべてのトークンを含むカラムを、タブで区切られた形式で出力します。出力はCoNLL形式に変換し、テキストに手動で注釈を付けることができます。次に、tNLPModelコンポーネントでそれを使用して、モデルとデザイン機能のトレーニングを行うことができます。

このコンポーネントは、Spark 1.6と2.0でのみ実行できます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。