Créer une analyse de rapprochement - 7.1

Guide utilisateur de Talend Data Fabric Studio

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Fabric
task
Création et développement
EnrichPlatform
Studio Talend

Talend DQ Portal est déprécié depuis Talend 7.1. Vous pouvez connecter le datamart DQ à votre propre outil de reporting.

Ce type d'analyse vous permet de comparer un ensemble de colonnes dans des bases de données ou des fichiers délimités et de créer des groupes d'enregistrements similaires à l'aide clés de bloc et de règles de rapprochement et/ou de règles de consolidation.

Pourquoi et quand exécuter cette tâche

Cette analyse vous permet de créer des règles de rapprochement et de les tester sur des données afin d'évaluer le nombre de doublons avant d'utiliser ces règles de rapprochement dans le composant tMatchGroup, par exemple. Vous pouvez tester les règles de rapprochement sur des colonnes de la même table uniquement.

Prérequis : vous devez avoir sélectionné la perspective Profiling du Studio. Au moins une connexion à une base de données ou à un fichier doit être créée sous le nœud Metadata. Pour plus d'informations, consultez Se connecter à une base de données.

La séquence de configuration d'une analyse de rapprochement comprend les étapes suivantes :

Procédure

  1. La création de la connexion à une source de données à partir de l'éditeur si aucune connexion n'a été définie dans le dossier Metadata dans le référentiel du Studio.
    Pour plus d'informations, consultez Configurer une analyse de rapprochement.
  2. Définition d'une table ou d'un groupe de colonnes dans lesquelles chercher les enregistrements similaires à l'aide processus de rapprochement.
  3. Définition d'une clé de bloc afin de réduire le nombre de paires à comparer.
    Pour plus d'informations, consultez Définir une règle de rapprochement.
  4. Définition d'une clé de bloc et des méthodes de rapprochement selon lesquelles les enregistrements similaires sont regroupés. Pour plus d'informations, consultez Définir une règle de rapprochement.
  5. Export des règles de rapprochement à partir de l'éditeur d'analyse de rapprochement et centralisation dans le référentiel du Studio.
    Pour plus d'informations, consultez Importer ou exporter des règles de rapprochement.
  6. Génération des rapports d'analyse de rapprochement et historisation dans une base de données distante. Ces rapports vous permettent de comparer les statistiques actuelles et historiques afin de déterminer s'il y a eu dégradation ou amélioration des données. Pour plus d'informations, consultez Que sont les rapports ?.
  7. Accès à différents outils analytiques qui vous permettent d'explorer et de monitorer les rapports générés dans le Studio. Pour plus d'informations concernant le portail, consultez le Guide utilisateur et administrateur deTalend DQ Portal. Pour plus d'informations concernant l'installation du Portail, consultez le Guide d'installation et de migration Talend.