Accéder au contenu principal Passer au contenu complémentaire

Créer une analyse de rapprochement

L'analyse de rapprochement vous permet de comparer un ensemble de colonnes dans des bases de données ou des fichiers délimités et de créer des groupes d'enregistrements similaires à l'aide de clés de bloc, de clés de rapprochement et de règles de consolidation.

Avant de commencer

Au moins une connexion à une base de données ou à un fichier est définie dans le dossier Metadata.

Pourquoi et quand exécuter cette tâche

Cette analyse vous permet de créer des règles de rapprochement et de les tester sur des données afin d'évaluer le nombre de doublons. Vous pouvez tester les règles de rapprochement sur des colonnes de la même table uniquement.

Talend DQ Portal est déprécié depuis Talend 7.1.

Procédure

  1. La création de la connexion à une source de données à partir de l'éditeur si aucune connexion n'a été définie dans le dossier Metadata dans le référentiel du Studio.
    Pour plus d'informations, consultez Configurer une analyse de rapprochement (uniquement en anglais).
  2. Définition d'une table ou d'un groupe de colonnes dans lesquelles chercher les enregistrements similaires à l'aide processus de rapprochement.
    Pour plus d'informations, consultez Définir une analyse de rapprochement dans le dossier Analysis (uniquement en anglais) ou Définir une analyse de rapprochement dans le dossier Metadata (uniquement en anglais).
  3. Définition d'une clé de bloc afin de réduire le nombre de paires à comparer.
    Pour plus d'informations, consultez Définir une règle de rapprochement (uniquement en anglais).
  4. Définition d'une clé de bloc et des méthodes de rapprochement selon lesquelles les enregistrements similaires sont regroupés. Pour plus d'informations, consultez Définir une règle de rapprochement (uniquement en anglais).
  5. Export des règles de rapprochement à partir de l'éditeur d'analyse de rapprochement et centralisation dans le référentiel du Studio.
    Pour plus d'informations, consultez Importer ou exporter des règles de rapprochement (uniquement en anglais).
  6. Génération des rapports d'analyse de rapprochement et sauvegarde dans une base de données distante. Ces rapports vous permettent de comparer les statistiques actuelles et historiques afin de déterminer l'évolution des données. Pour plus d'informations, consultez Que sont les rapports ? (uniquement en anglais).
  7. Accès à différents outils analytiques qui vous permettent d'explorer et de monitorer les rapports générés dans le Studio. Pour plus d'informations concernant le portail, consultez le Guide d'utilisation et d'administration deTalend DQ Portal. Pour plus d'informations concernant l'installation du Portail, consultez le Guide d'installation et de migration Talend.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !