T-Swooshアルゴリズムを使ったルール - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

T-Swooshアルゴリズムを使用して重複を検出したり、サバイバーシップ機能を使用して類似のレコードをマージしてマスターレコードを作成する方法を定義したりすることができます。このような新しくマージされたレコードは、新たな重複を検出するために使用されます。

T-SwooshアルゴリズムとVSRアルゴリズムの違いは以下のとおりです。
  • T-Swooshアルゴリズムを使用する場合、マスターレコードは一般に、入力レコードのリストに存在しない新しいレコードとなります。
  • T-Swooshアルゴリズムを使用する場合は、各カラムにマスターレコードを作成するためのサバイバーシップ機能を定義できます。