解析ルールを作成する - 7.3

Standardization

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化

手順

  1. tStandardizeRowコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを表示します。
  2. [Column to parse] (解析するカラム)リストから、[product] (製品)を選択します。
  3. [Conversion rules] (変換ルール)テーブルで、基本ルールと詳細ルールを次のように定義します。
    • [+]ボタンをクリックして2つのカラムを追加します。最初のカラムに"Amount" 、2番目のカラムに"LiquidAmount"という名前を付けます。

    • 基本ルールのタイプとしてFormatを選択し、"INT WHITESPACE* WORD"を読み取るように定義します。

    • 詳細ルールのタイプとしてRegExpを選択し、"\\d+\\s*(L|ML)\\b"を読み取るように定義します。

      詳細ルールは、基本ANTLRルールの後に実行されます。"Amount"ルールは、3つの文字列の金額をトークン化します。これは、数値の前にあるどの単語にも一致します。次に、RegExpルールは、ANTLRによって作成された各トークンを正規表現と照合します。

  4. [Generate parser code in Routines] (ルーチン上の分析コードを生成する)ボタンをクリックして、 Profiling パースペクティブの[DQ Repository] (DQリポジトリー)ツリービューにある[Routines] (ルーチン)フォルダーの下にコードを生成します。
    このステップは必須です。このステップを行わないとジョブは実行されません。
  5. [Advanced settings] (詳細設定)ビューで、[Output format] (出力形式)エリアでデフォルトで選択されているオプションをそのまま使います。
    [Max edits for fuzzy match] (ファジーマッチの最大編集)は、デフォルトで1に設定されています。
  6. tLogRowコンポーネントをダブルクリックして、[Mode] (モード)エリアで[Table (print values in cells of a table)] (テーブル(テーブルのセルの出力値))オプションを選択します。