Enrichissement des bibliothèques de types sémantiques via l'interface

Guide utilisateur de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
6.4
2.1
EnrichProdName
Talend MDM Platform
Talend Real-Time Big Data Platform
Talend Data Services Platform
Talend Big Data
Talend Data Management Platform
Talend Data Fabric
Talend ESB
Talend Data Integration
Talend Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation
Lorsque vous ajoutez un jeu de données, Talend Data Preparation suggère automatiquement un des types sémantiques supportés pour chaque colonne.

Si le type sémantique proposé par Talend Data Preparation pour une colonne n'est pas le type souhaité, vous pouvez le modifier manuellement en cliquant sur la flèche blanche dans l'en-tête de la colonne.

Cela vous permet de choisir parmi les types sémantiques présents dans Talend Data Preparation par défaut. Consultez Types sémantiques prédéfinis pour plus d'informations. Vous pouvez aller plus loin en créant vos propres types sémantiques, ainsi qu'en mettant à jour ou supprimant les types sémantiques existants, afin d'adapter Talend Data Preparation à votre entreprise.

Les modifications des types sémantiques sont faites directement dans l'interface de Talend Data Preparation, via l'onglet Semantic types du menu de gauche.
Toutes les modifications sont stockées à l'aide de Talend Dictionary Service et sont propagées à travers les différents produits Talend.

La disponibilité de Talend Dictionary Service dépend de votre licence.

Dans Talend Dictionary Service, les types sémantiques sont divisés en trois catégories principales :
  • le type DICT, basé sur une liste de valeurs fermée ou ouverte,
  • le type REGEX qui compare vos données par rapport à une expression régulière présélectionnée.
  • le type COMPOUND, sous lequel vous pouvez grouper plusieurs types existants.

Pour activer les interactions entre Talend Dictionary Service et Talend Data Preparation, vous devez compléter les prérequis suivants :

  • Talend Dictionary Service doit être installé et en cours de fonctionnement.
  • Talend Administration Center doit être installé et en cours de fonctionnement.
  • Votre type d'utilisateur de Talend Administration Center doit être Master Data Management ou Data Management.
  • Votre rôle d'utilisateur de Talend Administration Center doit être Designer ou Operation manager.
  • La case Data Preparation User doit être cochée pour votre utilisateur dans Talend Administration Center, avec l'un des trois rôles configuré dans le champ Data Preparation Role.
  • Dans le fichier <install_folder>\dataprep\config\application.properties, la propriété dataquality.semantic.update.enable est configurée à true.