Ce type d'analyse vous permet de comparer un ensemble de colonnes dans des bases de données ou des fichiers délimités et de créer des groupes d'enregistrements similaires à l'aide clés de bloc et de règles de rapprochement et/ou de règles de consolidation.
Pourquoi et quand exécuter cette tâche
Cette analyse vous permet de créer des règles de rapprochement et de les tester sur des données afin d'évaluer le nombre de doublons avant d'utiliser ces règles de rapprochement dans le composant tMatchGroup, par exemple. Vous pouvez tester les règles de rapprochement sur des colonnes de la même table uniquement.
Prérequis : vous devez avoir sélectionné la perspective Profiling du Studio Talend. Au moins une connexion à une base de données ou à un fichier doit être créée sous le nœud Metadata.
La séquence de configuration d'une analyse de rapprochement comprend les étapes suivantes :