Activer l'apprentissage automatique sur les modèles de données - 8.0

Guide d'administration de Talend Data Catalog

Version
8.0
Language
Français (France)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Catalog
Content
Administration et monitoring
Gouvernance de données

L'opération de classification de données utilise le modèle de données pour chercher des correspondances entre les classes de données et les objets importés sur la base d'un critère de correspondance.

Lorsque vous approuvez ou rejetez une classe de données d'apprentissage, Talend Data Catalog absorbe les informations et améliore sa compréhension du modèle de données.

Avant de commencer

  • Un rôle global avec la capacité Application Administration (Administration de l'application) vous a été assigné.
  • Vous avez activé l'option Auto Learning (Apprentissage automatique) dans les propriétés de la classe de données.
  • Vous devez avoir échantillonné et profilé les données de l'objet sélectionné.

Procédure

  1. Ouvrez la page des détails de l'objet que vous souhaitez utliser comme base d'apprentissage.
  2. Attribuez la classe de données manuellement à cet objet.
  3. Allez dans MANAGE (Gestion) > Data Classes (Classes de données) pour ouvrir les propriétés de la classe de données d'apprentissage.
    Si vous voyez des nombres en bleu près des valeurs dans la zone Data Pattern (Modèle de données), cela signifie qu'un apprentissage a été réalisé.
    Les nombres en bleu près des valeurs représentent le pourcentage des instances des données correspondant à une valeur spécifique, avec un minimum de 10 %.

    Talend Data Catalog récupère toutes les valeurs ou tous les modèles possibles conformes au pourcentage spécifié dans le champ Matching threshold (Seuil de rapprochement).

    Les modèles de données ayant les valeurs les plus élevées en bleu sont généralement plus précis. Vous pouvez ajuster la liste des valeurs ou modèles possibles.
  4. Décochez la case Auto Learning (Apprentissage automatique) pour désactiver l'option.
  5. Ajustez la liste des modèles de données en supprimant les modèles les moins précis.
  6. Sauvegardez vos modifications.

Résultats

Lorsque vous avez un bon ensemble de modèles, vous pouvez invoquer les classifications des données sur d'autres objets afin d'associer automatiquement les classes de données avec ces objets.