Règles avec l'algorithme T-Swoosh - 7.1

Guide utilisateur de Talend Data Services Platform Studio

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Services Platform
task
Création et développement
EnrichPlatform
Studio Talend

Vous pouvez utiliser l'algorithme T-Swoosh afin de trouver les doublons et définir comment sont fusionnés deux enregistrements similaires pour créer un enregistrement maître, à l'aide d'une fonction de consolidation. Ces nouveaux enregistrements fusionnés sont utilisés pour trouver des doublons.

Les différences entre les algorithmes T-Swoosh et VSR sont les suivantes :
  • Lorsque vous utilisez l'algorithme T-Swoosh,enregistrement de données maître est généralement un nouvel enregistrement qui n'existe pas dans la liste des enregistrements d'entrée.
  • Lorsque vous utilisez l'algorithme T-Swoosh, vous pouvez définir une fonction de consolidation pour chaque colonne afin de créer un enregistrement maître.