-
Dans la perspective Profiling, cliquez-droit sur Metadata et créez une connexion au fichier de sortie duplicated_records généré par le Job.
Pour plus d'informations, consultez la partie Profiling de données dans le Guide d'utilisation du Studio Talend.
-
Développez la nouvelle connexion fichier sous Metadata, cliquez-droit dessus et sélectionnez Analyze matches.
-
Suivez les étapes de l'assistant afin de définir les métadonnées de l’analyse, puis cliquez sur Finish pour ouvrir l'éditeur d'analyse.
-
Dans la table Matching Key, définissez une clé de rapprochement sur la colonne Code, afin de regrouper les enregistrements selon leur identification, les enregistrements ayant le même code sont regroupés.
-
Cliquez sur Chart sous la table pour afficher les doublons générés selon la distribution Bernoulli distribution précédemment sélectionnée dans le Job.