Enrichissement des bibliothèques de types sémantiques - Cloud

Guide d'utilisation de Talend Cloud Data Inventory

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration et monitoring > Gestion des connexions
Gouvernance de données
Qualité et préparation de données > Enrichissement de données
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Identification de données

Lorsque vous ajoutez un jeu de données et que vous ouvrez son échantillon, l'application suggère automatiquement l'un des types sémantiques supportés pour chaque champ ou colonne.

Si le type sémantique proposé par l'application pour une colonne n'est pas le type souhaité, vous pouvez le modifier manuellement en cliquant sur l'icône de menu dans l'en-tête de la colonne. Pour plus d'informations, consultez Changer le type sémantique d'une colonne.

Cela vous permet de choisir parmi les types sémantiques présents dans les applications Talend Cloud par défaut. Pour plus d'informations, consultez Types sémantiques prédéfinis. Vous pouvez aller plus loin en créant vos propres types sémantiques, ainsi qu'en mettant à jour ou supprimant les types sémantiques existants, afin d'adapter Talend Cloud à votre entreprise.

Remarque : Vous pouvez télécharger jusqu'à 10 Mo de contenu dans Talend Dictionary Service par tenant.

Les modifications des types sémantiques sont effectuées directement dans Talend Cloud Data Inventory, Talend Cloud Pipeline Designer, Talend Cloud Data Stewardship ou dans l'interface de Talend Cloud Data Preparation, via l'onglet Semantic types du menu de gauche.

Toutes les modifications sont stockées à l'aide de Talend Dictionary Service et sont propagées à travers les différentes applications Talend Cloud.

La disponibilité de Talend Dictionary Service dépend de votre licence.

Dans Talend Dictionary Service, les types sémantiques sont divisés en trois catégories principales :

  • le type DICT, basé sur une liste de valeurs fermée ou ouverte,
  • le type REGEX qui compare vos données par rapport à une expression régulière présélectionnée,
  • le type COMPOUND, sous lequel vous pouvez grouper plusieurs types existants.

Pour permettre les interactions entre Talend Dictionary Service et les applications Talend Cloud compatibles, vous devez satisfaire les prérequis suivants :

  • Votre licence dans doit inclure la qualité de données (Data Quality), c'est-à-dire à partir de Data Management.
  • Votre utilisateur ou utilisatrice Talend Cloud doit avoir le rôle Semantic types manager de l'application Dictionary service attribué dans Talend Cloud Management Console, en plus de l'un des rôles de Talend Cloud Data Inventory, Talend Cloud Pipeline Designer, Talend Cloud Data Stewardship ou Talend Cloud Data Preparation.