Configurer les indicateurs système et personnalisés - 6.2

Talend Big Data Platform Studio Guide utilisateur

EnrichVersion
6.2
EnrichProdName
Talend Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

La seconde étape, après la définition des colonnes à analyser est de configurer les indicateurs statistiques pour chaque colonne définie.

Note

Vous pouvez également utiliser des indicateurs personnalisés lors de l'analyse de données dans un fichier délimité, si un indicateur Java personnalisé a déjà été créé. Pour plus d'informations, consultez Définir des indicateurs Java personnalisés.

Prérequis : Une analyse d'un fichier délimité doit être ouverte dans l'éditeur d'analyse de la perspective Profiling du studio. Pour plus d'informations, consultez Définir les colonnes à analyser.

Afin de configurer des indicateurs système pour la (les) colonne(s) à analyser, procédez comme suit :

  1. Suivez la procédure décrite dans Définir les colonnes à analyser.

  2. Dans la vue Data preview, dans l'éditeur d'analyse, cliquez sur Select indicators afin d'ouvrir la boîte de dialogue [Indicator Selection].

  3. Configurez les indicateurs dans la boîte de dialogue [Indicator Selection], comme décrit dans Définir des indicateurs système ou personnalisés.

    Dans cet exemple, cochez Simple Statistics pour toutes les colonnes (All columns), Text Statistics pour la colonne first_name et Soundex Frequency également pour la colonne first_name.

    Note

    Vous pouvez définir les indicateurs de statistiques de texte sur une colonne uniquement si son type de data mining est nominal. Sinon, ces indicateurs sont grisés dans la boîte de dialogue.

    Les indicateurs sélectionnés sont attachés aux colonnes analysées dans la vue Analyzed Columns.