Définir des indicateurs système ou personnalisés - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-02-13
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Avant de commencer

Une analyse de colonne(s) doit être ouverte dans l'éditeur de la perspective Profiling du Studio Talend.

Procédure

  1. Dans la vue Data preview de l'éditeur d'analyse, cliquez sur Select indicators pour ouvrir la boîte de dialogue Indicator Selection.
  2. Dans la boîte de dialogue Indicator Selection :
    Remarque :

    Il n'est pas très utile d'utiliser les statistiques de fréquence des modèles sur une colonne de type Date dans des bases de données, lors de l'exécution de l'analyse avec le moteur SQL. Aucune erreur de qualité de données n'est retournée par l'indicateur, car toutes les dates sont affichées selon un format.

    Si vous attachez Date Pattern Frequency à une colonne de date dans votre analyse, vous pouvez générer une expression régulière de date à partir des résultats de l'analyse.

  3. Cliquez sur OK.
    Les indicateurs sélectionnés sont attachés aux colonnes analysées dans la vue Analyzed Columns.
    L'analyse de cet exemple fournit/calcule :
    • les statistiques simples de toutes les colonnes,
    • les caractéristiques des champs textuels, à l'aide d'indicateurs de statistiques textuelles et le nombre de valeurs les plus fréquentes pour chaque enregistrement distinct dans les indicateurs,
    • les modèles dans la colonne email pour afficher les modèles fréquents et rares, afin que vous puissiez identifier plus facilement les problèmes de qualité de données, à l'aide d'indicateurs de statistiques de fréquence de modèle,
    • l'écart, l'écart interquartile, ainsi que les valeurs moyenne et médiane des données numériques dans la colonne total_sales, à l'aide d'indicateurs de statistiques de résumé,
    • la fréquence des chiffres 1 à 9 dans les chiffres de ventes, afin de détecter la fraude, à l'aide des indicateurs de détection de fraude.