Gérer les classes de données - 8.0

Guide d'administration de Talend Data Catalog

Version
8.0
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Catalog
Content
Administration et monitoring
Gouvernance de données
Last publication date
2023-11-22

La classification de données vous permet de détecter, de comprendre et de classifier la nature et l'objectif des éléments contenus dans les sources de données importées dans votre catalogue.

Vous pouvez classifier des objets importés avec des termes du glossaire afin de définir ces éléments techniques en des termes métiers compréhensibles de tous·tes. La classification de données peut également vous permettre de trouver des relations cachées entre ces objets.

Talend Data Catalog vous permet d'automatiser les processus d'identification et de classification de données à l'aide de la capacité de profiling de données et des classes de données. Cela vous permet de protéger automatiquement les données sensibles.

Vous pouvez voir et gérer les classes de données existantes et en créer de nouvelles depuis MANAGE (Gestion) > Data Classes (Classes de données).

Types des classes de données

Talend Data Catalog vous permet d'identifier et de classifier les données sensibles automatiquement.
  • Les classes de données détectées détectent automatiquement la nature des données en se basant sur une énumération, des motifs et des expressions régulières prédéfinies. La classification de données détectées utilise la capacité de profiling et d'échantillonnage de données.
  • Les classes de métadonnées détectées détectent les classes par attributs de métadonnées. Elles vous assistent dans la détection de données ne pouvant être identifiées avec la classification de données détectées, comme la date de naissance qui n'a pas de modèles de données uniques. La classification de métadonnées détectées fonctionne grâce à la capacité MQL.
  • Les classes composées sont basées sur plusieurs classes de métadonnées détectées et de données détectées.

Vous pouvez utiliser ces classes de données pour profiler et rapprocher les critères de masquage des données sensibles. Les classes de données et métadonnées détectées partagent la même infrastructure pour PII et le masquage de données.

Classifications de données et de métadonnées détectées

La classification de données détectées détecte automatiquement les modèles de données fréquents. Elle est moins centrée sur l'apport de définitions.

La classification de métadonnées détectées apporte des définitions générales et faisant autorité. Elle est plus flexible mais moins précise que la classification de données détectées.

Classifications de données pour les objets importés

Un objet importé peut avoir :
  • une définition ou une classification de données détectées,
  • plusieurs classifications de métadonnées détectées (relations avec les termes métier),
  • plusieurs classifications de données proposées, approuvées et attribuées (relations avec des classes de données).
Par exemple, vous pouvez classifier plusieurs objets importés ayant différents types et modèles de données avec le même terme métier.

Il est recommandé d'être aussi précis·e que possible avec les classifications de données et d'avoir une classification approuvée ou attribuée pour un objet importé.

Lignage du flux sémantique

Talend Data Catalog utilise les classifications de données et de métadonnées pour implémenter des lookups de la définition déduite et des éléments liés pour le lignage du flux sémantique.