Libeller automatiquement les colonnes avec des classes de données - Cloud

Talend Cloud Data Catalog Guide de prise en main de

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Catalog
Content
Gouvernance de données
Last publication date
2024-01-12

Catégorisez les métadonnées dans la table de base de données anonymized_orders, à l'aide des classes de données, du profiling et de l'échantillonnage de données.

Avant de commencer

  • Vous avez restauré la sauvegarde du projet suivant et modifié la configuration : tdc_gsg_sources_files\use-case-2-using_and_contributing\repo_backup.zip. Pour plus d'informations, consultez Restaurer une sauvegarde de projet dans le référentiel.
  • L'échantillonnage et le profiling de données ont été activés et configurés lors de l'import des métadonnées. L'échantillonnage et le profiling de données sont requis pour effectuer l'attribution automatique de mots-clés pour la classification de données.
  • Un rôle d'objet ayant les fonctionnalités Metadata viewing (Visualisation de métadonnées) et Data viewing (Visualisation de données) vous a été attribué.
  • Un rôle d'objet ayant la fonctionnalité Data Classification Editing (Modification des classifications de données) vous a été attribué.

Procédure

  1. Dans la barre de recherche, saisissez anonymized_orders table.
  2. Cliquez sur anonymized_orders pour accéder à sa page d'objet et ouvrez l'onglet Columns (Colonnes).
  3. Dans la barre d'outils, cliquez sur Columns (Colonnes) et sélectionnez le type d'affichage Grid (Grille).
  4. Glissez-déposez la colonne Data Classifications (Classifications des données) depuis Available columns (Colonnes disponibles) vers Selected columns (Colonnes sélectionnées) pour l'afficher en vue tabulaire Grid.
    Talend Cloud Data Catalog contient déjà des libellés proposés. Les mots-clés avec une ligne bleue pointillée ne sont pas approuvés. Les mots-clés avec une ligne bleue simple sont approuvés.
  5. Avant d'approuver les classes de données proposées pour email_address, cliquez sur le nom de la colonne email_address pour ouvrir sa page d'objet et visualiser les statistiques et autres informations relatives à ces données.
    Les informations de profiling de données s'affichent dans l'onglet Overview (Vue d'ensemble).
  6. Retournez dans la page de la table anonymized_orders et cliquez sur l'onglet Data Sample (Échantillon de données) afin de prévisualiser les données de l'échantillon. Cet onglet affiche les lignes d'échantillon extraites depuis le jeu de données.
  7. Retournez dans l'onglet Columns (Colonnes) et cliquez sur l'icône représentant une coche afin d'approuver la classe de données Email (E-mail) pour email_address.

Résultats

Vous pouvez à présent implémenter un glossaire afin de documenter le vocabulaire de l'entreprise.