解析ルールを作成する - Cloud

解析ルールを作成する - Cloud - 8.0

Standardization

Version

Cloud

8.0

Language

日本語

Product

Talend Big Data

Talend Big Data Platform

Talend Data Fabric

Talend Data Integration

Talend Data Management Platform

Talend Data Services Platform

Talend ESB

Talend MDM Platform

Talend Real-Time Big Data Platform

Module

Talend Studio

Content

ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化

データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化

データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化

Last publication date

2024-02-28

手順

tStandardizeRowコンポーネントをダブルクリックして[Basic settings] (基本設定)ビューを表示します。
[Column to parse] (解析するカラム)リストから、[product] (製品)を選択します。
[Conversion rules] (変換ルール)テーブルで、基本ルールと詳細ルールを次のように定義します。
- [+]ボタンをクリックして2つのカラムを追加します。最初のカラムに"Amount" 、2番目のカラムに"LiquidAmount"という名前を付けます。
- 基本ルールのタイプとしてFormatを選択し、"INT WHITESPACE* WORD"を読み取るように定義します。
- 詳細ルールのタイプとしてRegExpを選択し、"\\d+\\s*(L|ML)\\b"を読み取るように定義します。
  
  詳細ルールは、基本ANTLRルールの後に実行されます。"Amount"ルールは、3つの文字列の金額をトークン化します。これは、数値の前にあるどの単語にも一致します。次に、RegExpルールは、ANTLRによって作成された各トークンを正規表現と照合します。
[Generate parser code in Routines] (ルーチン上の分析コードを生成する)ボタンをクリックして、 Profiling パースペクティブの[DQ Repository] (DQリポジトリー)ツリービューにある[Routines] (ルーチン)フォルダーの下にコードを生成します。
このステップは必須です。このステップを行わないとジョブは実行されません。
[Advanced settings] (詳細設定)ビューで、[Output format] (出力形式)エリアでデフォルトで選択されているオプションをそのまま使います。
[Max edits for fuzzy match] (ファジーマッチの最大編集)は、デフォルトで1に設定されています。
tLogRowコンポーネントをダブルクリックして、[Mode] (モード)エリアで[Table (print values in cells of a table)] (テーブル(テーブルのセルの出力値))オプションを選択します。