ジョブの実行 - 7.3

Fuzzy matching

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント

手順

ジョブを保存し、F6をクリックして実行します。

タスクの結果

tFuzzyUniqRowLevenshteinメソッドを使用して、定義された3つのカラムを別々に比較し、Double Metaphoneメソッドを使用して[City] (都市)カラムのデータを比較し、最後に一意の行と重複する行を定義された出力ファイルに渡します。このサンプルでは、最初の2つの行が一致しているため、2番目の行は 「duplicates」出力に入ります。

生成されたFIDカラムは、現在のレコードが参照する元のレコードの参照識別子を示します。

3行目は一意であり、「一意」の出力に入ります。

生成されたUIDカラムは、メインレコード用に生成された識別子です。