Configurer l'analyse de rapprochement - 7.0

Data privacy

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
EnrichPlatform
Studio Talend

Procédure

  1. Dans la perspective Profiling , cliquez-droit sur Metadata et créez une connexion au fichier de sortie duplicated_records généré par le Job.
    Pour plus d'informations, consultez la partie Profiling de données dans le Guide utilisateur du Studio Talend .
  2. Développez la nouvelle connexion fichier sous Metadata, cliquez-droit dessus et sélectionnez Analyze matches.
  3. Suivez les étapes de l'assistant afin de définir les métadonnées de l’analyse, puis cliquez sur Finish pour ouvrir l'éditeur d'analyse.
  4. Dans la table Matching Key, définissez une clé de rapprochement sur la colonne Code, afin de regrouper les enregistrements selon leur identification, les enregistrements ayant le même code sont regroupés.
  5. Cliquez sur Chart sous la table pour afficher les doublons générés selon la distribution Bernoulli distribution précédemment sélectionnée dans le Job.