Analyse de doublons - 6.3

Talend Big Data Platform Studio Guide utilisateur

EnrichVersion
6.3
EnrichProdName
Talend Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Vous pouvez utiliser l'analyse de rapprochement dans la perspective Profiling du studio afin de comparer des colonnes dans des bases de données ou des fichiers délimités et de créer des groupes d'enregistrements similaires à l'aide l'algorithme VSR ou T-Swoosh.

Cette analyse vous fournit un moyen simple de créer des règles de rapprochement, de les tester sur un ensemble de colonnes et de voir les résultats directement dans l'éditeur. Après avoir testé vos règles de rapprochement sur les données, vous pouvez les exporter à partir de l'éditeur et les sauvegarder dans le référentiel du studio, afin de les importer et les utiliser ultérieurement dans les composants de rapprochement, comme les composants de rapprochement, notamment le tMatchGroup, le tRecordMatching, le tGenKey et les composants Hadoop de rapprochement, par exemple.

Vous pouvez également utiliser la perspective Profiling afin de définir des règles de rapprochement dans l'éditeur de règles et les sauvegarder dans le référentiel du studio. Pour plus d'informations, consultez Créer une règle de rapprochement.