Enrichissement des bibliothèques de types sémantiques en ligne de commande - 7.2

Guide d'utilisation de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Talend Dictionary Service en ligne de commande est déprécié à partir de la version 7.1 de Talend.

Lorsque vous ajoutez un jeu de données, Talend Data Preparation suggère automatiquement un des types sémantiques supportés pour chaque colonne. Si le type sémantique proposé par Talend Data Preparation pour une colonne n'est pas celui souhaité, vous pouvez manuellement le modifier en cliquant sur la flèche blanche dans l'en-tête de la colonne.

Cela vous permet de choisir parmi les types sémantiques présents dans Talend Data Preparation par défaut. Consultez Types sémantiques prédéfinis pour plus d'informations. Vous pouvez aller plus loin en créant vos propres types sémantiques, ainsi qu'en mettant à jour ou supprimant les types sémantiques existants, afin d'adapter Talend Data Preparation à votre entreprise.

Les modifications des types sémantiques s'effectuent en utilisant Talend Dictionary Service. Cet outil stocke toutes les bibliothèques sémantiques utilisées dans les différents produits Talend, notamment Talend Data Preparation. Toutes les modifications que vous effectuez sur le serveur de Talend Dictionary Service sont instantanément disponibles dans Talend Data Preparation. La disponibilité de Talend Dictionary Service dépend de votre licence.

Dans Talend Dictionary Service, les types sémantiques sont divisés en trois catégories principales :
  • le type DICT, basé sur une liste de valeurs ouverte ou fermée.
  • le type REGEX, comparant vos données à une expression régulière présélectionnée.
  • le type COMPOUND, sous lequel vous pouvez grouper plusieurs types existants.

Pour afficher une liste de toutes les commandes disponibles dans Talend Dictionary Service, allez au niveau <Dictionary_Service_Path>/command-line et saisissez la commande suivante, selon votre système d'exploitation :

  • category_manager.bat -h commande pour Windows.
  • ./category_manager.sh -h pour Linux.

Pour permettre les interactions entre Talend Dictionary Service et Talend Data Preparation, vous devez satisfaire les prérequis suivants :

  • Talend Dictionary Service doit être installé et en cours de fonctionnement.
  • Talend Administration Center doit être installé et en cours de fonctionnement.
  • Votre type d’utilisateur de Talend Administration Center est Master Data Management ou Data Quality
  • La case Data Preparation User est cochée pour votre utilisateur dans Talend Administration Center, avec l'un des trois rôles possibles configuré dans le champ Data Preparation Role.
  • Dans le fichier <install_folder>\dataprep\config\application.properties, la propriété dataquality.semantic.update.enable est configurée à true.