ジョブを実行する - 7.3

Standardization

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化

手順

  1. ジョブを保存し、[F6]を押して実行します。
    tLogRowコンポーネントは、ジョブが分析できなかったデータをStudioのコンソールに表示します。
    正規化および標準化されたデータは、出力Excelファイルに書き込まれます。
  2. tFileOutputExcelコンポーネントを右クリックし、[Data viewer] (データビューアー)を選択します。
    Studioに標準化されたデータのプレビューが開きます。
    定義したBrandRangeColorのルールにより、入力フローの各トークンがインデックス文字列と照合され、インデックス文字列と完全に一致する入力文字列のみが抽出されます。11行目を例にとると、このレコードはどのカラーインデックス文字列とも完全に一致していないため、このレコードから色は抽出されていません。
    tStandardizeRowの基本設定で、Colorルールの検索モードをMatch anyに変更してから、ジョブを実行します。
    行11のレコードの色が抽出されたことがわかります。このレコードには、カラーインデックス"Extra Deep Base"に一致する"EXTRA"という単語が1つあります。これは、Match any検索モードによればレコードに色があると見なすのに十分です。
    tStandardizeRowコンポーネントで使用可能なさまざまな検索モードを使うと、期待するデータを標準化して出力できます。