T-Swooshアルゴリズムを使ったルール - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

T-Swooshアルゴリズムを使用して重複を検出したり、サバイバーシップ機能を使用して類似のレコードをマージしてマスターレコードを作成する方法を定義したりできます。このような新しくマージされたレコードは、新たな重複を検出するために使用されます。

T-SwooshアルゴリズムとVSRアルゴリズムの違いは以下のとおりです。T-Swooshアルゴリズムを使用する場合:
  • 一般的に、マスターレコードは入力レコードのリストに存在しない新しいレコードとなります。
  • マスターレコードを作成するためのサバイバーシップ機能を各カラムで定義できます。