Explorer les résultats de l'analyse de corrélation numérique - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Avant de commencer

Une analyse de corrélation numérique doit avoir été définie et exécutée dans la perspective Profiling du Studio Talend.

Procédure

  1. Dans la vue Analysis Results de l'éditeur d'analyses, cliquez sur Graphics, Simple Statistics ou Data afin d'afficher le graphique généré, le nombre d'enregistrements analysés ou les données analysées, respectivement.
    Dans la vue Graphics, les données placées dans le graphique à bulles ont différentes couleurs et la légende précise quelle couleur se réfère à quel type de données.
    Résultat graphique de la moyenne d'âge par rapport au nombre total.

    Plus une bulle est proche de l'axe de gauche, moins vous pouvez avoir confiance en la moyenne de la colonne numérique. Pour la bulle sélectionnée dans l'exemple ci-dessus, le nom de la société est manquant, et il y a seulement deux enregistrements de données, d'où le fait que la bulle soit proche de l'axe de gauche. Vous ne pouvez être sûr de la moyenne d'âge avec seulement deux enregistrements. Lorsque vous cherchez des problèmes de qualité de données, ces bulles peuvent indiquer des valeurs problématiques.

    Les bulles proches du haut et du bas du graphique peuvent également indiquer des problèmes liés à la qualité de données, une moyenne d'âge trop basse ou trop élevée dans l'exemple ci-dessus.

  2. À partir du graphique généré, vous pouvez :
    • décocher la case des valeurs que vous souhaitez masquer dans le graphique à bulles,
    • placer votre curseur sur l'une des bulles pour afficher les valeurs des données corrélées sur cette position,
    • cliquer-droit sur l'une des bulles et sélectionner :
      • Show in full screen : pour ouvrir le graphique généré en plein écran.
      • View rows pour accéder à une liste de toutes les lignes analysées dans la colonne sélectionnée.

Résultats

La capture d'écran ci-dessous est un exemple de l'éditeur SQL affichant les valeurs des données corrélées sur la position sélectionnée.
Vue d'ensemble de l'éditeur SQL.

Dans l'éditeur SQL, vous pouvez sauvegarder la requête exécutée et l'afficher sous les nœuds Libraries > Source Files dans la vue DQ Repository si vous cliquez sur l'icône de sauvegarde dans la barre d'outils de l'éditeur. Pour plus d'informations, consultez Sauvegarder les requêtes exécutées sur les indicateurs.

La vue Simple Statistics affiche le nombre d'enregistrements analysés appartenant à une certaine catégorie, comme le nombre de lignes, le nombre de valeurs distinctes et uniques, ainsi que le nombre de doublons.

Tableau et graphique affichant les résultats pour l'indicateur Simple Statistics (Statistiques simples).

La vue Data affiche les données analysées.

Données analysées dans la section Data (Données).

Vous pouvez trier les données listées dans le tableau des résultats simplement en cliquant sur l'en-tête d'une colonne du tableau.