ファーストネーム内のLevenshtein距離1または2のチェック - 7.3

Fuzzy matching

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント

このシナリオは、上記のシナリオに基づいています。tFuzzyMatchコンポーネントの最小距離と最大距離の設定のみが変更され、表示される出力が変更されます。

Talendがサポートしているテクノロジーの詳細は、Talendコンポーネントを参照してください。

手順

  1. tFuzzyMatch[Component] (コンポーネント)ビューで、最小距離を0から1に変更します。これは正確な一致を直ちに除外します(距離は0になります)。
  2. 最大距離も2に変更してください。最大2文字の不一致を示すすべての一致するエントリが出力されます。
    その他の変更は必要ありません。
  3. 複数の参照がメインフローエントリと一致する可能性があるので、[Matching item separator] (項目セパレータの一致)が定義されていることをご確認ください。
  4. 新しいジョブを保存し、[F6]を押して実行します。
    編集距離が2に設定されているため、メインフローの一部のエントリは複数の参照エントリと一致します。

タスクの結果

次のシナリオで説明するように、メタフォンという別のメソッドを使用して、メインフローと参照間の距離を評価することもできます。