Accéder au contenu principal Passer au contenu complémentaire

Explorer les résultats de l'analyse de corrélation numérique

Avant de commencer

Une analyse de corrélation numérique doit avoir été définie et exécutée dans la perspective Profiling du Studio Talend.

Procédure

  1. Dans la vue Analysis Results de l'éditeur d'analyses, cliquez sur Graphics, Simple Statistics ou Data afin d'afficher le graphique généré, le nombre d'enregistrements analysés ou les données analysées, respectivement.
    Dans la vue Graphics, les données placées dans le graphique à bulles ont différentes couleurs et la légende précise quelle couleur se réfère à quel type de données.
    Résultat graphique de la moyenne d'âge par rapport au nombre total.

    Plus une bulle est proche de l'axe de gauche, moins vous pouvez avoir confiance en la moyenne de la colonne numérique. Pour la bulle sélectionnée dans l'exemple ci-dessus, le nom de la société est manquant, et il y a seulement deux enregistrements de données, d'où le fait que la bulle soit proche de l'axe de gauche. Vous ne pouvez être sûr de la moyenne d'âge avec seulement deux enregistrements. Lorsque vous cherchez des problèmes de qualité de données, ces bulles peuvent indiquer des valeurs problématiques.

    Les bulles proches du haut et du bas du graphique peuvent également indiquer des problèmes liés à la qualité de données, une moyenne d'âge trop basse ou trop élevée dans l'exemple ci-dessus.

  2. À partir du graphique généré, vous pouvez :
    • décocher la case des valeurs que vous souhaitez masquer dans le graphique à bulles,
    • placer votre curseur sur l'une des bulles pour afficher les valeurs des données corrélées sur cette position,
    • cliquer-droit sur l'une des bulles et sélectionner :
      • Show in full screen : pour ouvrir le graphique généré en plein écran.
      • View rows pour accéder à une liste de toutes les lignes analysées dans la colonne sélectionnée.

Résultats

La capture d'écran ci-dessous est un exemple de l'éditeur SQL affichant les valeurs des données corrélées sur la position sélectionnée.
Vue d'ensemble de l'éditeur SQL.

Dans l'éditeur SQL, vous pouvez sauvegarder la requête exécutée et l'afficher sous les nœuds Libraries > Source Files dans la vue DQ Repository si vous cliquez sur l'icône de sauvegarde dans la barre d'outils de l'éditeur. Pour plus d'informations, consultez Sauvegarder les requêtes exécutées sur les indicateurs.

La vue Simple Statistics affiche le nombre d'enregistrements analysés appartenant à une certaine catégorie, comme le nombre de lignes, le nombre de valeurs distinctes et uniques, ainsi que le nombre de doublons.

Tableau et graphique affichant les résultats pour l'indicateur Simple Statistics (Statistiques simples).

La vue Data affiche les données analysées.

Données analysées dans la section Data (Données).

Vous pouvez trier les données listées dans le tableau des résultats simplement en cliquant sur l'en-tête d'une colonne du tableau.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !