Créer une analyse de rapprochement - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-02-13
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

L'analyse de rapprochement vous permet de comparer un ensemble de colonnes dans des bases de données ou des fichiers délimités et de créer des groupes d'enregistrements similaires à l'aide de clés de bloc, de clés de rapprochement et de règles de consolidation.

Avant de commencer

Au moins une connexion à une base de données ou à un fichier est définie dans le dossier Metadata.

Pourquoi et quand exécuter cette tâche

Cette analyse vous permet de créer des règles de rapprochement et de les tester sur des données afin d'évaluer le nombre de doublons. Vous pouvez tester les règles de rapprochement sur des colonnes de la même table uniquement.

Disponible dans :

Big Data Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Talend DQ Portal est déprécié depuis Talend 7.1.

Procédure

  1. La création de la connexion à une source de données à partir de l'éditeur si aucune connexion n'a été définie dans le dossier Metadata dans le référentiel du Studio.
    Pour plus d'informations, consultez Configurer une analyse de rapprochement.
  2. Définition d'une table ou d'un groupe de colonnes dans lesquelles chercher les enregistrements similaires à l'aide processus de rapprochement.
  3. Définition d'une clé de bloc afin de réduire le nombre de paires à comparer.
    Pour plus d'informations, consultez Définir une règle de rapprochement.
  4. Définition d'une clé de bloc et des méthodes de rapprochement selon lesquelles les enregistrements similaires sont regroupés. Pour plus d'informations, consultez Définir une règle de rapprochement.
  5. Export des règles de rapprochement à partir de l'éditeur d'analyse de rapprochement et centralisation dans le référentiel du Studio.
    Pour plus d'informations, consultez Importer ou exporter des règles de rapprochement.
  6. Génération des rapports d'analyse de rapprochement et sauvegarde dans une base de données distante. Ces rapports vous permettent de comparer les statistiques actuelles et historiques afin de déterminer l'évolution des données. Pour plus d'informations, consultez Que sont les rapports ?.
  7. Disponible dans :

    Big Data Platform

    Data Fabric

    Data Management Platform

    Data Services Platform

    MDM Platform

    Real-Time Big Data Platform

    Accès à différents outils analytiques qui vous permettent d'explorer et de monitorer les rapports générés dans le Studio. Pour plus d'informations concernant le portail, consultez le Guide d'utilisation et d'administration deTalend DQ Portal. Pour plus d'informations concernant l'installation du Portail, consultez le Guide d'installation et de migration Talend.