前処理プロセスの設定 - Cloud

前処理プロセスの設定 - Cloud - 8.0

Text standardization

Version

Cloud

8.0

Language

日本語

Product

Talend Big Data Platform

Talend Data Fabric

Talend Data Management Platform

Talend Data Services Platform

Talend MDM Platform

Talend Real-Time Big Data Platform

Module

Talend Studio

Content

ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化 > テキスト標準化コンポーネント

データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化 > テキスト標準化コンポーネント

データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化 > テキスト標準化コンポーネント

Last publication date

2024-02-28

tNormalizeをダブルクリックして、[Basic settings] (基本設定)ビューを表示し、コンポーネントのプロパティを定義します。
[Column to normalize] (正規化するカラム)リストから、[translation] (変換)を選択します。
これにより、[translation] (変換)カラムのデータ文字列が単語に分割されます。
[Item separator] (項目区切り)フィールドに、[translation] (変換)カラムのデータを区切るセパレーター(この例ではスペース)を入力します。
tFilterRowをダブルクリックして、[Basic settings] (基本設定)ビューを表示し、コンポーネントのプロパティを定義します。
論理演算子を選択して、単純なフィルタリングと詳細モードを組み合わせます。
[Conditions] (条件)エリアで、[+]ボタンをクリックして、1つ以上の条件を出力フローに追加します。次に、対応するテーブルカラムで以下のように操作します:
- 操作する入力カラムを選択します。
- リストから必要なファンクションを選択します。
- 入力カラムで値をバインドする演算子を選択します。
- コンテンツフィルタリングの値を入力します。
  
  この例では、[translation] (変換)カラムの3文字未満のすべての単語のフィルタリング処理を行います。