Créer une analyse de rapprochement - 7.0

Guide d'utilisation de Talend Open Studio for Data Quality

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Open Studio for Data Quality
task
Création et développement
EnrichPlatform
Studio Talend
Ce type d'analyse vous permet de comparer un ensemble de colonnes dans des bases de données ou des fichiers délimités et de créer des groupes d'enregistrements similaires à l'aide clés de bloc et de règles de rapprochement et/ou de règles de consolidation.

Pourquoi et quand exécuter cette tâche

Cette analyse vous permet de créer des règles de rapprochement et de les tester sur des données afin d'évaluer le nombre de doublons. Vous pouvez tester les règles de rapprochement sur des colonnes de la même table uniquement.

Prérequis : Au moins une connexion à une base de données ou à un fichier doit être créée sous le nœud Metadata. Pour plus d'informations, consultez Se connecter à une base de données.

La séquence de configuration d'une analyse de rapprochement comprend les étapes suivantes :

Procédure

  1. La création de la connexion à une source de données à partir de l'éditeur si aucune connexion n'a été définie dans le dossier Metadata dans le référentiel du Studio.
    Pour plus d'informations, consultez Configurer une analyse de rapprochement.
  2. Définition d'une table ou d'un groupe de colonnes dans lesquelles chercher les enregistrements similaires à l'aide processus de rapprochement.
  3. Définition d'une clé de bloc afin de réduire le nombre de paires à comparer.
    Pour plus d'informations, consultez Définir une règle de rapprochement.
  4. Définition d'une clé de bloc et des méthodes de rapprochement selon lesquelles les enregistrements similaires sont regroupés. Pour plus d'informations, consultez Définir une règle de rapprochement.
  5. Export des règles de rapprochement à partir de l'éditeur d'analyse de rapprochement et centralisation dans le référentiel du Studio.
    Pour plus d'informations, consultez Importer ou exporter des règles de rapprochement.