Explorer les résultats d'analyse

Talend Data Fabric Studio Guide utilisateur

EnrichVersion
6.5
EnrichProdName
Talend Data Fabric
task
Qualité et préparation de données
Création et développement
EnrichPlatform
Studio Talend

Prérequis : Une analyse de corrélation numérique doit avoir été définie et exécutée dans la perspective Profiling du studio.

Dans la vue Analysis Results de l'éditeur d'analyse :

  • Cliquez sur Graphics, Simple Statistics ou Data afin d'afficher le graphique généré, le nombre d'enregistrements analysés ou les données analysées, respectivement.

Dans la vue Graphics, les données placées dans le graphique à bulles ont différentes couleurs et la légende précise quelle couleur se réfère à quel type de données.

Plus une bulle est proche de l'axe de gauche, moins vous pouvez avoir confiance en la moyenne de la colonne numérique. Pour la bulle sélectionnée dans l'exemple ci-dessus, le nom de la société est manquant, et il y a seulement deux enregistrements de données, d'où le fait que la bulle soit proche de l'axe de gauche. Vous ne pouvez être sûr de la moyenne d'âge avec seulement deux enregistrements. Lorsque vous cherchez des problèmes de qualité de données, ces bulles peuvent indiquer des valeurs problématiques.

Les bulles proches du haut et du bas du graphique peuvent également indiquer des problèmes liés à la qualité de données, une moyenne d'âge trop basse ou trop élevée dans l'exemple ci-dessus.

Dans le graphique généré, vous pouvez :

  • cocher la case de la (des) valeur(s) que vous souhaitez masquer dans le graphique à bulles,

  • placer votre souris sur l'une des bulles pour afficher les valeurs corrélées sur cette position,

  • cliquer-droit sur l'une des bulles et sélectionner :

Option

Pour...

Show in full screen

ouvrir le graphique généré en plein écran.

View rows

accéder à une liste de toutes les lignes analysées dans la colonne sélectionnée.

La capture d'écran ci-dessous est un exemple de l'éditeur SQL affichant les valeurs des données corrélées sur la position sélectionnée.

Dans l'éditeur SQL, vous pouvez sauvegarder la requête exécutée et la lister sous les dossiers Libraries > Source Files dans la vue DQ Repository, si vous cliquez sur l'icône de sauvegarde dans la barre d'outils de l'éditeur. Pour plus d'informations, consultez Sauvegarder les requêtes exécutées sur les indicateurs.

La vue Simple Statistics affiche le nombre d'enregistrements analysés appartenant à certaines catégories, y compris le nombre de lignes, le nombre de valeurs distinctes et uniques, ainsi que le nombre de valeurs en doublon.

La vue Data affiche les données analysées.

Vous pouvez trier les données listées dans le tableau des résultats en cliquant simplement sur l'en-tête d'une colonne dans le tableau.