T-Swooshアルゴリズムを使ったルール - 7.0

テーブル分析

EnrichVersion
7.0
EnrichProdName
Talend Data Fabric
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング

T-Swooshアルゴリズムを使用して重複を検出したり、サバイバーシップ機能を使用して類似のレコードをマージしてマスターレコードを作成する方法を定義したりすることができます。このような新しくマージされたレコードは、新たな重複を検出するために使用されます。

T-SwooshアルゴリズムとVSRアルゴリズムの違いは以下のとおりです。
  • T-Swooshアルゴリズムを使用する場合、マスターレコードは一般に、入力レコードのリストに存在しない新しいレコードとなります。
  • T-Swooshアルゴリズムを使用する場合は、各カラムにマスターレコードを作成するためのサバイバーシップ機能を定義できます。