Enrichissement des bibliothèques de types sémantiques

Guide utilisateur de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
6.3
2.0
EnrichProdName
Talend Data Integration
Talend Data Fabric
Talend Real-Time Big Data Platform
Talend ESB
Talend Data Services Platform
Talend Data Management Platform
Talend MDM Platform
Talend Big Data
Talend Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Lorsque vous ajoutez un jeu de données, Talend Data Preparation suggère automatiquement l'un des types sémantiques supportés pour chaque colonne. Si le type sémantique proposé par Talend Data Preparation pour une colonne n'est pas celui souhaité, vous pouvez manuellement le modifier en cliquant sur la flèche blanche dans l'en-tête de la colonne.

Cela vous permet de choisir dans la liste des types sémantiques présents par défaut dans Talend Data Preparation. Consultez Types sémantiques prédéfinis pour plus d'informations. Vous pouvez allez plus loin en créant vos propres types sémantiques, ainsi qu'en modifiant ou supprimant ceux existant, afin que Talend Data Preparation et votre entreprise parlent le même langage.

Les modifications des types sémantiques s'effectuent en utilisant Talend Dictionary Service. Cet outil stocke toutes les bibliothèques sémantiques utilisées dans les différents produits Talend, notamment Talend Data Preparation. Toutes les modifications que vous effectuez sur le serveur de Talend Dictionary Service sont instantanément disponibles dans Talend Data Preparation. La disponibilité de Talend Dictionary Service dépend de votre licence.

Dans Talend Dictionary Service, les types sémantiques sont divisés en deux catégories principales :
  • le type DICT, basé sur une liste de valeurs ouverte ou fermée.
  • le type REGEX, comparant vos données à une expression régulière présélectionnée.

Pour afficher une liste des commandes disponibles dans Talend Dictionary Service, allez à <Dictionary_Service_Path>/command-line et saisissez la commande suivante, selon votre système d'exploitation :

  • category_manager.bat -h sous Windows.
  • ./category_manager.sh -h sous Linux.

Pour activer les interactions entre Talend Dictionary Service et Talend Data Preparation, vous devez compléter les prérequis suivants :

  • Talend Dictionary Service est installé et en cours d'exécution.
  • Talend Administration Center est installé et en cours d'exécution.
  • Votre type d’utilisateur de Talend Administration Center est Master Data Management ou Data Quality
  • La case Data Preparation User est cochée pour votre utilisateur dans Talend Administration Center, avec l'un des trois rôles possibles configuré dans le champ Data Preparation Role.
  • Dans le fichier <install_folder>\dataprep\config\application.properties, la propriété dataquality.semantic.update.enable est configurée à true.