Configurer des indicateurs système

Guide de prise en main de Talend Big Data Platform

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data Platform
task
Installation et mise à niveau
Création et développement
Qualité et préparation de données > Profiling de données
Qualité et préparation de données > Nettoyage de données
Cette analyse de colonnes utilise des indicateurs prêts à l'emploi pour fournir des statistiques simples comme le nombre de lignes, de valeurs blanches et de valeurs en doublon dans les colonnes Email et Phone.

Avant de commencer

Procédure

  1. Dans la zone Data Preview dans l'éditeur d'analyse, cliquez sur Select indicators pour ouvrir la boîte de dialogue [Indicator Selection].
  2. Développez Simple Statistics sélectionnez les indicateurs Row Count, Blank Count et Duplicate Count. Cliquez sur OK pour fermer l'assistant.

    Vous voulez consulter le nombre de lignes, de valeurs blanches et de valeurs en doublon dans les colonnes Email et Phone pour contrôler la cohérence des données.

    Des indicateurs sont ainsi ajoutés dans les colonnes qui se trouvent dans la zone Analyzed Columns.

  3. Cliquez sur l'icône à côté des indicateurs Duplicate Count et Blank Count et dans le champ Upper threshold, saisissez la valeur 0.

    Définir des limites dans les colonnes Email and Phone est très utile car le nombre des valeurs blanches et des valeurs en doublon est indiqué en rouge dans les résultats d'analyse.