メイン コンテンツをスキップする

tNLPPreprocessing

テキストサンプルのプレパレーションを行い、複数のトークンに分割します。トークンは、単語、数字、または句読点の場合があります。

tNLPPreprocessingは、入力テキスト用のすべてのトークンを含むカラムを、タブで区切られた形式で出力します。出力はCoNLL形式に変換し、テキストに手動で注釈を付けることができます。次に、tNLPModelコンポーネントでそれを使用して、モデルとデザイン機能のトレーニングを行うことができます。

このコンポーネントは、Spark 1.6と2.0でのみ実行できます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。