Ajout d'un nouveau type sémantique composé - 7.3

Guide d'utilisation de Talend Data Stewardship

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Content
Administration et monitoring > Gestion des utilisateurs
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Gestion des tâches
Qualité et préparation de données > Gestion des types sémantiques
Last publication date
2023-10-03

Vous pouvez créer un type sémantique composé référençant d'autres types sémantiques publiés sur le serveur de Talend Dictionary Service et l'ajouter à la liste des types reconnus dans les modèles de données, dans Talend Data Stewardship.

Vous pouvez mélanger tous les types sémantiques lors de la création d'un type composé. Un type composé peut référencer d'autres types composés si les types enfants sont déjà publiés.

Imaginez que vous avez un fichier contenant des informations relatives à des clients des États-Unis, du Royaume-Uni, d'Allemagne et de France. Vous devez intervenir et valider les différents codes postaux par rapport à un type sémantique composé, que vous créez. Lorsque les données correspondent à l'un des types enfants, elles sont considérées comme valides et ne sont pas évaluées par rapport aux autres types référencés.

Lors de la définition d'un modèle de données dans Talend Data Stewardship, vous pouvez configurer le type sémantique pour la colonne contenant les codes postaux comme étant ce nouveau type composé, Zip_codes dans cet exemple.

Avant de commencer

Tous les types sémantiques enfants à utiliser dans le type composé sont créés et publiés.

Procédure

  1. Sélectionnez SEMANTIC TYPES > ADD SEMANTIC TYPE.
  2. Saisissez un nom et une description pour le nouveau type sémantique.
  3. Sélectionnez le type sémantique dans la liste Type.
  4. Laissez l'option Use for validation (Utiliser pour la validation) activée.

    Ce type composé sera utilisé pour définir les valeurs considérées comme bonnes ou mauvaises lors de l'application sur une colonne donnée. Le résultat de ce processus de validation peut être vu dans la barre de statistiques de chaque colonne de vos jeux de données.

    Dans cet exemple, si vous choisissez de désactiver l'option Use for validation, le type composé ne sera utilisé que pour l'exploration de données, et aucune valeur ne sera considérée comme invalide.

  5. Dans la liste Children types, sélectionnez les types sémantiques que vous souhaitez regrouper dans ce type composé.
  6. Cliquez sur SAVE AND PUBLISH pour envoyer le type sémantique au serveur Talend Dictionary Service et le rendre disponible à l'utilisation par Data Stewardship.
    Cliquer sur SAVE AS DRAFT stocke le nouveau type sur le serveur sans le propager au système. Le nouveau type n'est pas utilisable, sauf s'il est publié. Pour un exemple d'utilisation de cette option, imaginez que vous avez de nouveaux types sémantiques à déployer en tant que partie d'un nouveau projet. Vous pouvez préparer le travail en créant les types sémantiques et en les sauvegardant en tant que brouillon avant la mise en production du projet, puis vous pouvez déployer les types sémantiques le jour de la mise en production.
  7. Dans la page DATA MODELS, créez le modèle de données pour les données clients.
    La nouvelle catégorie sémantique Phone_numbers est disponible dans la liste des types sémantiques et vous pouvez la choisir pour la colonne contenant les numéros de téléphone.

Résultats

Lorsque vous chargez les données client·es dans Talend Data Stewardship, les données sont rapprochées et validées par rapport au type composé Phone_numbers que vous avez créé. Les données sont évaluées par rapport au premier type enfant et si elles correspondent, elles ne sont pas évaluées par rapport à d'autres types référencés.