Règles avec l'algorithme T-Swoosh - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-02-13
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Vous pouvez utiliser l'algorithme T-Swoosh afin de trouver les doublons et définir comment sont fusionnés deux enregistrements similaires pour créer un enregistrement maître, à l'aide d'une fonction de consolidation. Ces nouveaux enregistrements fusionnés sont utilisés pour trouver des doublons.

Les différences entre les algorithmes T-Swoosh et VSR sont les suivantes. Lorsque vous utilisez l'algorithme T-Swoosh :
  • L'enregistrement de données maître est généralement un nouvel enregistrement qui n'existe pas dans la liste des enregistrements d'entrée.
  • Vous pouvez définir une fonction de consolidation pour chaque colonne afin de créer un enregistrement maître.