Analyser la qualité d'un champ - Cloud

Guide d'utilisation de Talend Cloud Data Inventory

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration et monitoring > Gestion des connexions
Gouvernance de données
Qualité et préparation de données > Enrichissement de données
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Identification de données
Last publication date
2024-02-28

Avant de commencer

Vous avez appliqué au moins une règle de qualité de données à un champ.

Pourquoi et quand exécuter cette tâche

Dans cet exemple, vous utilisez les règles de données précédemment appliquées.

Procédure

  1. Connectez-vous en tant que dataset manager (gestionnaire des jeux de données) ou dataset administrator (administrateur des jeux de données), avec l'autorisation Rules - View (Règles - Visualiser).
    Pour obtenir l'autorisation Rules - View (Règles - Visualisation), le rôle Rules - Manager (Règles - Gestionnaire) ou Rules - Viewer (Règles - Observateur) doit vous être attribué.
  2. Ouvrez un jeu de données dans la vue Sample (Échantillon).
  3. Sélectionnez un champ sur lequel appliquer une règle.
    Les champs ayant une règle appliquée ont l'icône de règle de qualité de données affichée dans leur en-tête.
    Icône Data quality rule (Règle de qualité de données) dans le champ.
  4. Dans le panneau de droite, vous pouvez voir les valeurs invalides, non applicables et valides.
    Barre de statistiques pour une règle de qualité de données dans l'onglet Quality (Qualité).
    Code couleur pour la barre de statistiques
    Couleur Description
    Rouge Les valeurs sont invalides. Elles remplissent la condition mais pas l'expression de validation, ou la règle ne peut être exécutée sur ces valeurs. Par exemple, si une règle doit comparer une chaîne de caractères et un nombre.
    Vert clair Les valeurs ne sont pas applicables. Elles ne remplissent pas la condition et aucune expression de validation alternative n'a été définie
    Vert Les valeurs sont valides. Elles respectent toutes les instructions de la règle.
  5. Passez votre curseur sur chaque couleur pour afficher le nombre total et le pourcentage des valeurs.
    Nombre et pourcentage de valeurs valides pour une règle de qualité de données. Nombre et pourcentage de valeurs invalides pour une règle de qualité de données.
    Dans cet exemple :
    • Dans le champ delivery_country :
      • 193 valeurs sont valides. Cela signifie que le statut de la commande est In Process (En cours de traitement) et que le pays est correct par rapport au type sémantique Country.
      • 1 170 valeurs ne sont pas applicables. Cela signifie que le statut de la commande n'est pas In Process (En cours de traitement).
      • 137 valeurs sont invalides. Cela signifie que le statut de la commande est In Process (En cours de traitement) mais que le pays est incorrect par rapport au type sémantique Country.
    • Dans le champ customer_tin :
      • 589 valeurs sont valides. Cela signifie que le·a client·e est identifié·e comme entreprise et que le NIF (numéro d'identification fiscale) est renseigné.
      • 744 valeurs ne sont pas applicables. Cela signifie que le·a client·e n'est pas identifié·e comme entreprise.
      • 167 valeurs sont invalides. Cela signifie que le·a client·e est identifié·e comme entreprise mais que le NIF (numéro d'identification fiscale) n'est pas renseigné.
  6. Pour plus d'informations concernant une colonne, passez votre curseur sur la barre de statistiques de la colonne.
    Barre de statistiques de l'en-tête de la colonne.
    La barre de statistiques se compose des résultats du format des colonnes et des règles de qualité de données.
    Vous pouvez voir jusqu'à trois couleurs :
    Code couleur pour les barres de statistiques
    Couleur Description
    Rouge Les valeurs sont invalides selon le format des colonnes ou une règle de qualité de données.
    Gris Les cellules sont vides.
    Vert Les valeurs sont valides selon le format des colonnes et les règles de qualité de données. Les valeurs non applicables1 des règles de qualité de données sont indiquées en vert.

    Les valeurs ne sont pas applicables lorsqu'elles ne respectent pas la condition de la règle de qualité de données et qu'aucune expression alternative n'a été définie.