Qualité des jeux de données - Cloud

Guide d'utilisation de Talend Cloud Data Inventory

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration et monitoring > Gestion des connexions
Gouvernance de données
Qualité et préparation de données > Enrichissement de données
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Identification de données

Plusieurs indicateurs visuels vous permettent d'avoir une idée précise de la qualité de vos données.

Les indicateurs de qualité sont un moyen simple et rapide d'évaluer la qualité de vos données, au niveau des échantillons, ainsi qu'au niveau des enregistrements. Dans l'application, les données peuvent être classées en catégories, comme vides, valides ou invalides, par rapport au type sémantique automatiquement détecté, avec le code couleur suivant :

  • vert pour les données qui correspondent au format de la colonne,
  • orange pour les données qui ne correspondent pas au format de la colonne,
  • noir pour les cellules vides.

Les indicateurs de qualité se trouvent aux emplacements suivants :

  • Dans la liste des jeux de données :

    La qualité de vos jeux de données s'affiche sous forme d'une barre de statistiques. Placez votre curseur sur une couleur pour afficher les statistiques de qualité du jeu de données. Ce pourcentage, ainsi que le nombre exact de valeurs vides, invalides ou incorrectes sont affichés pour l'échantillon.

  • Depuis la vue d'ensemble du jeu de données :

    Dans la tuile Data quality de la vue d'ensemble du jeu de données, vous pouvez voir des diagrammes en barres indiquant le pourcentage exact et le nombre de valeurs vides, valides et invalides dans l'échantillon du jeu de données. Chaque catégorie s'affiche dans un diagramme dédié.

  • Depuis l'en-tête de l'échantillon du jeu de données :

    Dans l'en-tête au-dessus de votre jeu de données, vous pouvez également trouver les diagrammes en barres affichant la répartition des valeurs vides, valides et invalides dans l'échantillon du jeu de données. Chaque catégorie s'affiche dans un diagramme dédié. Placez votre curseur sur un diagramme pour voir les statistiques détaillées.

  • Dans la barre de statistiques :

    Lorsque vous utilisez la vue tabulaire de votre jeu de données, vous pouvez voir que chaque en-tête de colonne contient une barre de statistiques. Les statistiques affichées ici s'appliquent à chaque colonne spécifique. Placez votre curseur sur chaque couleur pour voir les statistiques détaillées de chaque catégorie. Dans la vue tabulaire, les cellules contenant des valeurs invalides par rapport au type sémantique de la colonne sont affichées avec une bordure gauche orange.