Créer une analyse de rapprochement - Cloud - 8.0

Guide d'utilisation de Talend Data Fabric Studio

Version
Cloud
8.0
Language
Français (France)
EnrichDitaval
Data Fabric
Product
Talend Data Fabric
Module
Studio Talend
Content
Création et développement
Ce type d'analyse vous permet de comparer un ensemble de colonnes dans des bases de données ou des fichiers délimités et de créer des groupes d'enregistrements similaires à l'aide clés de bloc et de règles de rapprochement et/ou de règles de consolidation.

Pourquoi et quand exécuter cette tâche

Cette analyse vous permet de créer des règles de rapprochement et de les tester sur des données afin d'évaluer le nombre de doublons avant d'utiliser ces règles de rapprochement dans le composant tMatchGroup, par exemple. Vous pouvez tester les règles de rapprochement sur des colonnes de la même table uniquement.

Prérequis : vous devez avoir sélectionné la perspective Profiling du Studio Talend. Au moins une connexion à une base de données ou à un fichier doit être créée sous le nœud Metadata.

La séquence de configuration d'une analyse de rapprochement comprend les étapes suivantes :

Procédure

  1. La création de la connexion à une source de données à partir de l'éditeur si aucune connexion n'a été définie dans le dossier Metadata dans le référentiel du Studio.
    Pour plus d'informations, consultez Configurer une analyse de rapprochement.
  2. Définition d'une table ou d'un groupe de colonnes dans lesquelles chercher les enregistrements similaires à l'aide processus de rapprochement.
  3. Définition d'une clé de bloc afin de réduire le nombre de paires à comparer.
    Pour plus d'informations, consultez Définir une règle de rapprochement.
  4. Définition d'une clé de bloc et des méthodes de rapprochement selon lesquelles les enregistrements similaires sont regroupés. Pour plus d'informations, consultez Définir une règle de rapprochement.
  5. Export des règles de rapprochement à partir de l'éditeur d'analyse de rapprochement et centralisation dans le référentiel du Studio.
    Pour plus d'informations, consultez Importer ou exporter des règles de rapprochement.
  6. Génération des rapports d'analyse de rapprochement et historisation dans une base de données distante. Ces rapports vous permettent de comparer les statistiques actuelles et historiques afin de déterminer s'il y a eu dégradation ou amélioration des données. Pour plus d'informations, consultez Que sont les rapports ?.