Ajout d'un nouveau type sémantique composé - Cloud

Guide utilisateur de Talend Cloud Data Stewardship

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Administration et monitoring > Gestion des utilisateurs
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Gestion des tâches
EnrichPlatform
Talend Data Stewardship

Vous pouvez créer un type sémantique composé référençant d'autres types sémantiques publiés sur le serveur de Talend Dictionary Service et l'ajouter à la liste des types reconnus dans les modèles de données, dans Talend Cloud Data Stewardship.

Vous pouvez mélanger tous les types sémantiques lors de la création d'un type composé. Un type composé peut référencer d'autres types composés si les types fils sont déjà publiés.

Imaginez que vous avez un fichier contenant des informations relatives à des clients des États-Unis, du Royaume-Uni, d'Allemagne et de France. Vous devez intervenir et valider les différents codes postaux par rapport à un type sémantique composé que vous avez créé. Une fois que les données correspondent à l’un des types fils, elles sont consdérées comme valides et ne sont pas évaluées par rapport aux autres types référencés.

Lors de la définition du modèle de données dans Talend Cloud Data Stewardship, vous pouvez configurer le type sémantique pour la colonne contenant les codes postaux comme étant ce nouveau type, Zip_codes dans cet exemple.

Avant de commencer

Tous les types sémantiques fils que vous souhaitez utiliser dans le type composé sont créés et publiés.

Procédure

  1. Sélectionnez SEMANTIC TYPES > ADD SEMANTIC TYPE.
  2. Saisissez un nom et une description pour le nouveau type sémantique.
  3. Sélectionnez le type sémantique dans la liste Type.
  4. Laissez l'option Use for validation activée.

    Ce type composé sera utilisé pour définir les valeurs considérées comme bonnes ou mauvaises lors de l'application sur une colonne donnée. Le résultat de ce processus de validation peut être vu dans la barre de statistiques de chaque colonne de vos jeux de données.

    Dans cet exemple, si vous choisissez de désactiver l'option Use for validation, le type composé ne sera utilisé que pour l'exploration de données, et aucune valeur ne sera considérée comme invalide.

  5. Dans la liste Children types, sélectionnez les types sémantiques que vous souhaitez regrouper dans ce type composé.
  6. Cliquez sur SAVE AND PUBLISH pour envoyer le type sémantique au serveur Talend Dictionary Service et le rendre disponible à l'utilisation par Data Stewardship.
    Cliquer sur SAVE AS DRAFT stocke le nouveau type sur le serveur sans le propager au système. Le nouveau type n'est pas utilisable, sauf s'il est publié. Pour un exemple d'utilisation de cette option, imaginez que vous avez de nouveaux types sémantiques à déployer en tant que partie d'un nouveau projet. Vous pouvez préparer le travail en créant les types sémantiques et en les sauvegardant en tant que brouillon avant la mise en production du projet, puis vous pouvez déployer les types sémantiques le jour de la mise en production.
  7. Dans la page DATA MODELS, créez le modèle de données pour les données clients.
    La nouvelle catégorie sémantique Phone_numbers est disponible dans la liste des types sémantiques et vous pouvez la choisir pour la colonne contenant les numéros de téléphone.

Résultats

Lorsque vous chargez les données clients dans Talend Cloud Data Stewardship, les données sont rapprochées et validées par rapport au type composé Phone_numbers que vous avez créé. Les données sont évaluées par rapport au premier type fils et, si ses données correspondent, elles ne sont pas évaluées par rapport aux autres types référencés, etc.