Règles avec l'algorithme T-Swoosh - Cloud - 8.0

Guide d'utilisation de Talend Data Fabric Studio

Version
Cloud
8.0
Language
Français (France)
EnrichDitaval
Data Fabric
Product
Talend Data Fabric
Module
Studio Talend
Content
Création et développement

Vous pouvez utiliser l'algorithme T-Swoosh afin de trouver les doublons et définir comment sont fusionnés deux enregistrements similaires pour créer un enregistrement maître, à l'aide d'une fonction de consolidation. Ces nouveaux enregistrements fusionnés sont utilisés pour trouver des doublons.

Les différences entre les algorithmes T-Swoosh et VSR sont les suivantes :
  • Lorsque vous utilisez l'algorithme T-Swoosh,enregistrement de données maître est généralement un nouvel enregistrement qui n'existe pas dans la liste des enregistrements d'entrée.
  • Lorsque vous utilisez l'algorithme T-Swoosh, vous pouvez définir une fonction de consolidation pour chaque colonne afin de créer un enregistrement maître.