Accéder au contenu principal Passer au contenu complémentaire

Configurer l'analyse de rapprochement

Procédure

  1. Dans la perspective Profiling, cliquez-droit sur Metadata et créez une connexion au fichier de sortie duplicated_records généré par le Job.
    Pour plus d'informations, consultez la partie Profiling de données dans le Guide d'utilisation du Studio Talend.
  2. Développez la nouvelle connexion fichier sous Metadata, cliquez-droit dessus et sélectionnez Analyze matches.
  3. Suivez les étapes de l'assistant afin de définir les métadonnées de l’analyse, puis cliquez sur Finish pour ouvrir l'éditeur d'analyse.
  4. Dans la table Matching Key, définissez une clé de rapprochement sur la colonne Code, afin de regrouper les enregistrements selon leur identification, les enregistrements ayant le même code sont regroupés.
  5. Cliquez sur Chart sous la table pour afficher les doublons générés selon la distribution Bernoulli distribution précédemment sélectionnée dans le Job.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !