Disponible dans...Big Data Platform
Cloud API Services Platform
Cloud Big Data Platform
Cloud Data Fabric
Cloud Data Management Platform
Data Fabric
Data Management Platform
Data Services Platform
MDM Platform
Real-Time Big Data Platform
Avant de commencer
Une analyse de corrélation numérique doit avoir été définie et exécutée dans la perspective
Profiling du
Studio Talend.
Procédure
-
Dans la vue Analysis Results de l'éditeur d'analyses, cliquez sur Graphics, Simple Statistics ou Data afin d'afficher le graphique généré, le nombre d'enregistrements analysés ou les données analysées, respectivement.
Dans la vue
Graphics, les données placées dans le graphique à bulles ont différentes couleurs et la légende précise quelle couleur se réfère à quel type de données.
Plus une bulle est proche de l'axe de gauche, moins vous pouvez avoir confiance en la moyenne de la colonne numérique. Pour la bulle sélectionnée dans l'exemple ci-dessus, le nom de la société est manquant, et il y a seulement deux enregistrements de données, d'où le fait que la bulle soit proche de l'axe de gauche. Vous ne pouvez être sûr de la moyenne d'âge avec seulement deux enregistrements. Lorsque vous cherchez des problèmes de qualité de données, ces bulles peuvent indiquer des valeurs problématiques.
Les bulles proches du haut et du bas du graphique peuvent également indiquer des problèmes liés à la qualité de données, une moyenne d'âge trop basse ou trop élevée dans l'exemple ci-dessus.
-
À partir du graphique généré, vous pouvez :
- décocher la case de la (des) valeur(s) que vous souhaitez masquer dans le graphique à bulles,
- placer votre curseur sur l'une des bulles pour afficher les valeurs corrélées sur cette position,
- cliquer-droit sur l'une des bulles et sélectionner :
Option |
Pour... |
Show in full screen |
ouvrir le graphique généré en plein écran. |
View rows |
accéder à une liste de toutes les lignes analysées dans la colonne sélectionnée. |
Résultats
La capture d'écran ci-dessous est un exemple de l'éditeur SQL affichant les valeurs des données corrélées sur la position sélectionnée.
Dans l'éditeur SQL, vous pouvez sauvegarder la requête exécutée et l'afficher sous les nœuds dans la vue DQ Repository si vous cliquez sur l'icône de sauvegarde dans la barre d'outils de l'éditeur. Pour plus d'informations, consultez Sauvegarder les requêtes exécutées sur les indicateurs.
La vue Simple Statistics affiche le nombre d'enregistrements analysés appartenant à une certaine catégorie, comme le nombre de lignes, le nombre de valeurs distinctes et uniques, ainsi que le nombre de doublons.
La vue Data affiche les données analysées.
Vous pouvez trier les données listées dans le tableau des résultats simplement en cliquant sur l'en-tête d'une colonne du tableau.