Enrichir les types sémantiques pour Talend Dictionary Service (ligne de commande) - 6.5

Guide utilisateur de Talend Data Stewardship

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Administration et monitoring > Gestion des utilisateurs
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Installation et mise à niveau
Qualité et préparation de données > Gestion des tâches
EnrichPlatform
Talend Data Stewardship

Talend Dictionary Service stocke les catégories sémantiques utilisées dans plusieurs produits Talend, notamment Talend Data Stewardship. Vous pouvez enrichir ces types sémantiques avec vos catégories personnelles. Toutes les modifications sont instantanément disponibles dans Talend Data Stewardship. Cependant, la disponibilité de Talend Dictionary Service dépend de votre licence.

Talend Data Stewardship permet de gérer des modèles de données, ce qui rend possible la validation syntaxique et sémantique des données. Vous pouvez définir les attributs dans le modèle de données et sélectionner leurs types parmi les types standard ou sémantiques prédéfinis stockés dans Talend Dictionary Service.

Lorsque des gestionnaires de campagnes définissent la structure des données à gérer dans une campagne, ils peuvent sélectionner parmi une liste prédéfinie le type sémantique de chaque attribut. Lorsqu'ils chargent des données dans Talend Data Stewardship, une validation interne du type de schéma est effectuée et les données sont affichées comme valides ou invalides.

Par exemple, la liste des entrées comprises par défaut dans Talend Data Stewardship pour les pays ne contient pas Republic of Angola, United States of America ou UK. Par conséquent, ces entrées sont considérées comme des noms de pays invalides lors du chargement dans Talend Data Stewardship.

Vous pouvez toutefois créer vos propres types sémantiques, ainsi que mettre à jour ou supprimer les types existants, afin que votre expérience avec Talend Data Stewardship soit adaptée à votre entreprise. Vous pouvez effectuer toutes ces options de gestion soit via une interface intégrée dans Talend Data Stewardship, soit en ligne de commande.

Sur le serveur, les types sémantiques sont divisés en plusieurs catégories :
  • le type Dictionary, basé sur une liste de valeurs fermée,
  • le type Regular expression, qui compare vos données à une expression régulière présélectionnée,
  • le type Compound type, qui compare vos données à différents types sémantiques référencés dans le type composé.

Pour afficher une liste de toutes les commandes disponibles dans Talend Dictionary Service, allez à <Dictionary_Service_Path>/command-line et saisissez la commande suivante selon votre système d'exploitation :

  • category_manager.bat -h commande pour Windows,
  • ./category_manager.sh -h pour Linux.
Pour permettre les interactions entre Talend Dictionary Service et Talend Data Stewardship, vous devez satisfaire les prérequis suivants :
  • Talend Dictionary Service doit être installé et en cours de fonctionnement.
  • Talend Administration Center doit être installé et en cours de fonctionnement.
  • Votre licence dans Talend Administration Center doit inclure la qualité de données (Data Quality).
  • Le rôle qui vous est assigné dans Talend Administration Center est Designer ou Operation manager et votre type d'utilisateur est au moins Data management.
  • La case Data Stewardship User est cochée pour votre utilisateur dans Talend Administration Center, avec un des rôles possibles configurés dans le champ Data Stewardship Role.
  • Dans le fichier <install_folder>\tds\apache-tomcat\conf\data-stewardship.properties, la propriété dataquality.dictionaryservice.enable est configurée à true.