Explorer les résultats de l'analyse de corrélation numérique - 7.1

Guide utilisateur de Talend Data Fabric Studio

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Fabric
task
Création et développement
EnrichPlatform
Studio Talend

Avant de commencer

Une analyse de corrélation numérique doit avoir été définie et exécutée dans la perspective Profiling du Studio Talend.

Procédure

  1. Dans la vue Analysis Results de l'éditeur d'analyses, cliquez sur Graphics, Simple Statistics ou Data afin d'afficher le graphique généré, le nombre d'enregistrements analysés ou les données analysées, respectivement.
    Dans la vue Graphics, les données placées dans le graphique à bulles ont différentes couleurs et la légende précise quelle couleur se réfère à quel type de données.

    Plus une bulle est proche de l'axe de gauche, moins vous pouvez avoir confiance en la moyenne de la colonne numérique. Pour la bulle sélectionnée dans l'exemple ci-dessus, le nom de la société est manquant, et il y a seulement deux enregistrements de données, d'où le fait que la bulle soit proche de l'axe de gauche. Vous ne pouvez être sûr de la moyenne d'âge avec seulement deux enregistrements. Lorsque vous cherchez des problèmes de qualité de données, ces bulles peuvent indiquer des valeurs problématiques.

    Les bulles proches du haut et du bas du graphique peuvent également indiquer des problèmes liés à la qualité de données, une moyenne d'âge trop basse ou trop élevée dans l'exemple ci-dessus.

  2. À partir du graphique généré, vous pouvez :
    • cocher la case de la (des) valeur(s) que vous souhaitez masquer dans le graphique à bulles,
    • placer votre souris sur l'une des bulles pour afficher les valeurs corrélées sur cette position,
    • cliquer-droit sur l'une des bulles et sélectionner :
      Option Pour...
      Show in full screen ouvrir le graphique généré en plein écran.
      View rows accéder à une liste de toutes les lignes analysées dans la colonne sélectionnée.

Résultats

La capture d'écran ci-dessous est un exemple de l'éditeur SQL affichant les valeurs des données corrélées sur la position sélectionnée.

Dans l'éditeur SQL, vous pouvez sauvegarder la requête exécutée et l'afficher sous les nœuds Libraries > Source Files dans la vue DQ Repository si vous cliquez sur l'icône de sauvegarde dans la barre d'outils de l'éditeur. Pour plus d'informations, consultez Sauvegarder les requêtes exécutées sur les indicateurs.

La vue Simple Statistics affiche le nombre d'enregistrements analysés appartenant à certaines catégories, y compris le nombre de lignes, le nombre de valeurs distinctes et uniques, ainsi que le nombre de valeurs en doublon.

La vue Data affiche les données analysées.

Vous pouvez trier les données listées dans le tableau des résultats simplement en cliquant sur l'en-tête d'une colonne du tableau.