Configurer des indicateurs système - 6.3

Talend Open Studio for Data Quality Guide de prise en main

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Data Quality
task
Installation et mise à niveau
Qualité et préparation de données
EnrichPlatform
Studio Talend

Cette analyse de colonnes utilise des indicateurs prêts à l'emploi pour fournir des statistiques simples comme le nombre de lignes, de valeurs blanches et de valeurs en doublon dans les colonnes Email et Phone.

Prérequis :

  1. Dans la zone Data Preview dans l'éditeur d'analyse, cliquez sur Select indicators pour ouvrir la boîte de dialogue [Indicator Selection].

  2. Développez Simple Statistics et sélectionnez les indicateurs Row Count, Blank Count et Duplicate Count. Cliquez sur OK pour fermer l'assistant.

    Vous voulez consulter le nombre de lignes, de valeurs blanches et de valeurs en doublon dans les colonnes Email et Phone pour contrôler la cohérence des données.

    Des indicateurs sont ainsi ajoutés dans les colonnes qui se trouvent dans la zone Analyzed Columns.

  3. Cliquez sur l'icône à côté des indicateur Duplicate Count et Blank Count et dans le champ Upper threshold, saisissez la valeur 0.

    Définir des limites dans les colonnes Email et Phone est très utile car le nombre des valeurs blanches et des valeurs en doublon est indiqué en rouge dans les résultats d'analyse.

    Pour plus d'informations concernant les types d'indicateur et leur utilisation lorsque les données sont analysées, consultez le Guide utilisateur du Studio Talend.