Mettre à jour un type sémantique existant - 6.5

Guide utilisateur de Talend Data Stewardship

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Administration et monitoring > Gestion des utilisateurs
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Installation et mise à niveau
Qualité et préparation de données > Gestion des tâches
EnrichPlatform
Talend Data Stewardship

Vous pouvez modifier un type sémantique existant dans Talend Dictionary Service, pour modifier la manière dont vos données sont validées dans Talend Data Stewardship.

Les types sémantiques prédéfinis dans Talend Data Stewardship sont basés sur des valeurs standard, mais vous pouvez les ajuster à vos données. Des données tombant dans une certaine catégorie prédéfinie peuvent être considérées comme invalides.

Prenez l'exemple d'un jeu de données contenant une liste de clients, avec leur adresse e-mail, leur date de naissance et leur pays de résidence. Vous pouvez constater que les entrées United States of America sont considérées comme invalides, alors que le nom réel du pays est employé.

Le problème ici est que United States of America n'est pas une valeur attendue pour le type sémantique country dans Talend Data Stewardship. L'entrée valide, dans ce cas, serait United States.

Pour éviter ce problème à l'avenir, vous allez mettre à jour le type sémantique country dans Talend Dictionary Service et ajouter United States of America à la liste des entrées valides. La modification sera automatiquement disponible dans Talend Data Stewardship.

Procédure

  1. Ouvrez une invite de commande et utilisez la commande cd pour aller dans au niveau du dossier <Dictionary_Service_Path>/command-line.
  2. Pour ajouter la valeur United States of America à la liste des pays valides, exécutez la commande suivante, selon votre système d'exploitation :
    • category_manager.bat -a -name COUNTRY -value "United States of America" sous Windows.
    • ./category_manager.sh -a -name COUNTRY -value "United States of America" sous Linux.

    Pour pouvoir utiliser cette commande, vous devez la saisir sur une ligne.

    Il vous est demandé de saisir vos identifiants d'accès à Talend Administration Center. La commande est exécutée dès qu'un identifiant et un mot de passe valides sont saisis.

  3. Pour afficher la liste des entrées dans le type sémantique country, exécutez la commande suivante, selon votre système d'exploitation :
    • category_manager.bat -e -name COUNTRY sous Windows.
    • ./category_manager.sh -e -name COUNTRY sous Linux.

    Vous pouvez constater que United States of America a bien été ajouté au bas de la liste des entrées valides pour le type sémantique country.

  4. Retournez dans Talend Data Stewardship et rafraîchissez la liste des tâches contenant les pays des clients, ou rouvrez-la.

    La modification du type sémantique est disponible dans Talend Data Stewardship et vous pouvez voir, dans la barre de statistiques, sous l'en-tête de la colonne, qu'il n'y a plus de valeur invalide.

Résultats

Le type sémantique country a été mis à jour manuellement pour supporter une nouvelle valeur.

À partir de maintenant, lorsque vous rencontrez des données correspondant au type sémantique country, United States of America sera considéré comme une valeur valide.

Pour afficher une liste de toutes les commandes disponibles dans Talend Dictionary Service, allez au niveau <Dictionary_Service_Path>/command-line et saisissez la commande suivante, selon votre système d'exploitatione :
  • category_manager.bat -h commande pour Windows.
  • ./category_manager.sh -h pour Linux.