Mise à jour d'un type sémantique existant - 7.2

Guide d'utilisation de Talend Data Stewardship

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Administration et monitoring > Gestion des utilisateurs
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Gestion des tâches
Qualité et préparation de données > Gestion des types sémantiques
EnrichPlatform
Talend Data Stewardship

Vous pouvez modifier un type sémantique existant dans Talend Dictionary Service afin de changer la manière dont sont validées vos données dans Talend Data Stewardship.

Les types sémantiques prédéfinis dans Talend Data Stewardship se basent sur des valeurs standard, mais il est possible que vous deviez les adapter pour qu'ils correspondent à vos données. Certaines données que vous considérez comme appartenant à une catégorie prédéfinie peuvent être considérées comme invalides.

Prenez l'exemple d'un jeu de données contenant une liste de clients, avec leur adresse e-mail, date de naissance et leur pays de résidence. Vous pouvez constater que toutes les entrées pour United States of America sont considérées comme invalides, alors qu'elles ne devraient pas, puisque c'est le nom officiel du pays.

Le problème est que United States of America n'est pas une valeur attendue pour le type sémantique country, dans Talend Data Stewardship. L'entrée valide serait United States.

Pour éviter de futurs problèmes, vous allez mettre à jour le type sémantique country dans Talend Dictionary Service et ajouter United States of America à la liste des entrées valides. Cette modification sera automatiquement disponible dans Talend Data Stewardship.

Procédure

  1. Ouvrez une invite de commande et utilisez la commande cd pour aller dans au niveau du dossier <Dictionary_Service_Path>/command-line.
  2. Pour ajouter la valeur United States of America à la liste des pays valides, exécutez la commande suivante, selon votre système d'exploitation :
    • category_manager.bat -a -name COUNTRY -value "United States of America", sous Windows.
    • ./category_manager.sh -a -name COUNTRY -value "United States of America", sous Linux.

    Pour pouvoir utiliser cette commande, vous devez l'écrire sur une seule ligne.

    Vos identifiants de connexion à Talend Administration Center vous sont demandés. La commande est exécutée après saisie d'un identifiant et mot de passe valides.

  3. Pour afficher la liste des entrées dans le type sémantique country, exécutez la commande suivante, selon votre système d'exploitation :
    • category_manager.bat -e -name COUNTRY, sous Windows.
    • ./category_manager.sh -e -name COUNTRY sous Linux.

    Vous pouvez constater que United States of America a bien été ajouté au bas de la liste des entrées valides pour le type sémantique country.

  4. Retournez dans Talend Data Stewardship et rafraîchissez la liste des tâches contenant les pays des clients, ou rouvrez-la.
    La modification du type sémantique est disponible dans Talend Data Stewardship et vous pouvez voir, dans la barre de statistiques, sous l'en-tête de la colonne, qu'il n'y a plus de valeur invalide.

Résultats

Le type sémantique country a été mis à jour manuellement pour supporter une nouvelle valeur.

À partir de maintenant, lorsque vous traitez des données rapprochées du type sémantique country, United States of America sera considérée comme une valeur valide.

Pour afficher la liste des commandes disponibles dans Talend Dictionary Service, allez dans <Dictionary_Service_Path>/command-line et saisissez la bonne commande selon votre système d'exploitation :
  • category_manager.bat -h sous Windows,
  • ./category_manager.sh -h sous Linux.