Exécuter l'analyse et afficher les résultats du profiling - 7.3

Exemples de Jobs et d'analyses de qualité de données

Version
7.3
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Open Studio for Data Quality
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Qualité et préparation de données
Last publication date
2023-03-02

Procédure

  1. Sauvegardez l'analyse de colonnes dans l'éditeur d'analyse puis appuyez sur F6 pour l'exécuter.
    Un groupe de diagrammes s'affiche dans le panneau Graphics, à droite de l'éditeur d'analyse, et montre les résultats de l'analyse de colonnes, notamment ceux de la mise en correspondance des modèles.
  2. Cliquez sur l'onglet Analysis Results au bas de l'éditeur d'analyse pour accéder à une vue plus détaillée des résultats.
    Ces résultats affichent les graphiques générés pour les colonnes analysées, ainsi que les tables détaillant les résultats des statistiques et des mises en correspondance des modèles.

Résultats

Les résultats du rapprochement de modèles montrent qu'environ 10 % des enregistrements d'adresses e-mail ne correspondent pas au modèle d'adresse e-mail standard. Les résultats de statistiques simples montrent qu'environ 8 % des enregistrements d'adresses e-mail sont vides et qu'environ 5 % sont des doublons. Les résultats du pattern frequency donnent le nombre d'enregistrements les plus fréquents pour chaque modèle distinct. Cela montre que les données ne sont pas cohérentes et que vous devez corriger et nettoyer les données d'emails avant de commencer votre compagne.

Les résultats de la colonne postal se présentent comme suit :

Les ensembles de résultats pour la colonne postal donnent le nombre d'enregistrements qui correspondent et le nombre d'enregistrements qui ne correspondent pas au format standard des codes postaux des États-Unis. Les ensembles de résultats donnent également le nombre de blancs et de doublons, ainsi que le nombre d'enregistrements les plus fréquents pour chaque modèle distinct. Ces résultats montrent que les données ne sont pas vraiment cohérentes.

Un certain pourcentage des clients ne peut être contacté ni par e-mail ni par courrier. Ces résultats montrent clairement que vos données ne sont pas vraiment cohérentes et qu'il faut qu'elles soient corrigées.