Échantillon du jeu de données - Cloud

Guide d'utilisation de Talend Cloud Data Inventory

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration et monitoring > Gestion des connexions
Gouvernance de données
Qualité et préparation de données > Enrichissement de données
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Identification de données

Après avoir créé un jeu de données, vous pouvez visualiser et comprendre son contenu via la vue de l'échantillon.

Remarque : Cette fonctionnalité est disponible pour les utilisateurs et utilisatrices de Talend Cloud Pipeline Designer et Talend Cloud Data Preparation lorsque Talend Cloud Data Inventory est activé pour le compte.

Talend Cloud Data Inventory peut afficher un échantillon de 10 000 enregistrements de vos jeux de données. Cela comprend les indicateurs de qualité au niveau des colonnes et des jeux de données. Vous pourrez également modifier le type sémantique des enregistrements afin de les données soient bien définies.

L'échantillon de début (Head sample) est sélectionné par défaut. Il affiche les 10 000 premiers enregistrements de votre jeu de données. Si vous devez travailler sur un échantillon plus représentatif de votre jeu de données, cliquez sur la flèche près de Head sample (Échantillon de début) et sélectionnez Random sample (Échantillon aléatoire) pour afficher 10 000 enregistrements aléatoirement sélectionnés.

L'échantillon du jeu de données est accessible depuis les emplacements suivants :

  • dans la liste des jeux de données,
  • dans la vue détaillée du jeu de données.

    En haut à droite de l'échantillon, vous pouvez choisir l'une des trois manières d'afficher les données :

    • Grid (Tabulaire) : les enregistrements s'affichent sous forme de tableau. C'est la vue par défaut lorsque vous ouvrez un échantillon.
      Remarque : L'astérisque qui se trouve parfois près du titre de la colonne signifie que cette colonne a été définie comme obligatoire dans le jeu de données source, avec des outils comme Salesforce.
    • Hierarchy (Hiérarchique) : les enregistrements sont affichés sous forme d'arborescence.
    • Raw (Brute) : les enregistrements sont affichés dans leur version sans modification et sans filtre.