Enrichissement des bibliothèques de types sémantiques - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données
Lorsque vous ajoutez un jeu de données, Talend Data Preparation suggère automatiquement un des types sémantiques supportés pour chaque colonne.

Si le type sémantique proposé par Talend Data Preparation pour une colonne n'est pas le type souhaité, vous pouvez le modifier manuellement en cliquant sur l'icône de menu dans l'en-tête de la colonne.

Cela vous permet de choisir parmi les types sémantiques présents dans Talend Data Preparation par défaut. Pour plus d'informations, consultez Types sémantiques prédéfinis. Vous pouvez aller plus loin en créant vos propres types sémantiques, ainsi qu'en mettant à jour ou supprimant les types sémantiques existants, afin d'adapter Talend Data Preparation à votre entreprise.

Remarque : Vous pouvez charger jusqu'à 10 Mo de contenu dans Talend Dictionary Service par tenant.
Les modifications des types sémantiques sont faites directement dans l'interface de Talend Data Preparation, via l'onglet Semantic types (Types sémantiques) du menu de gauche.
Toutes les modifications sont stockées à l'aide de Talend Dictionary Service et sont propagées à travers les différents produits Talend.

La disponibilité de Talend Dictionary Service dépend de votre licence.

Dans Talend Dictionary Service, les types sémantiques sont divisés en trois catégories principales :
  • le type DICT, basé sur une liste de valeurs fermée ou ouverte,
  • le type REGEX qui compare vos données par rapport à une expression régulière présélectionnée,
  • le type COMPOUND, sous lequel vous pouvez grouper plusieurs types existants.

Pour permettre les interactions entre Talend Dictionary Service et Talend Data Preparation, vous devez satisfaire les prérequis suivants :

  • Votre licence dans doit inclure la qualité de données (Data Quality), c'est-à-dire à partir de Data Management.
  • votre utilisateur·rice Talend Cloud doit avoir le rôle Semantic types manager de l’application Dictionary service assigné dans Talend Cloud Management Console, en plus de ses rôles Talend Cloud Data Preparation.