Supprimer un type sémantique - 6.5

Guide utilisateur de Talend Data Stewardship

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Administration et monitoring > Gestion des utilisateurs
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Installation et mise à niveau
Qualité et préparation de données > Gestion des tâches
EnrichPlatform
Talend Data Stewardship

Vous pouvez supprimer un type sémantique dans Talend Dictionary Service afin de le supprimer de la liste des types de données reconnus dans Talend Data Stewardship.

Vous pouvez supprimer des types sémantiques et des types standard prédéfinis.

La variété des types sémantiques présents par défaut dans Talend Data Stewardship peut créer des problèmes dans certaines situations. Par exemple, un nombre composé de cinq chiffres peut être interprété comme code postal des États-Unis, mais également de France ou d'Allemagne, puisqu'ils partagent le même format.

Imaginez que vous travaillez pour une entreprise aux États-Unis et que vous ne traitez que des données provenant de clients des États-Unis, notamment des codes postaux. Il serait plus utile pour vous de conserver uniquement les codes postaux américains dans la liste des types sémantiques reconnus.

Avec Talend Dictionary Service, vous allez simplement supprimer les autres types sémantiques correspondant au format à cinq chiffres et conserver US_POSTAL_CODE. La modification est instantanément disponible dans Talend Data Stewardship et, à partir de là, vous allez toujours valider une colonne de codes postaux par rapport au type sémantique US_POSTAL_CODE.

Procédure

  1. Ouvrez une invite de commande.
  2. Utilisez la commande cd, allez dans le dossier <Dictionary_Service_Path>/command-line.
  3. Pour afficher les noms des types sémantiques existants et voir lesquels supprimer, exécutez la commande suivante selon votre système d'exploitation :
    • category_manager.bat -l -type REGEX sous Windows.
    • ./category_manager.sh -l -type REGEX sous Linux.

    Vos identifiants d'accès à Talend Administration Center vous sont demandés. La commande est exécutée après saisie d'un identifiant et mot de passe valides.

    La liste de types sémantiques basés sur des expressions régulières est affichée. Vous pouvez identifier le noms des types à supprimer, FR_POSTAL_CODE or DE_POSTAL_CODE notamment.

  4. Pour supprimer le type sémantique des codes postaux français, exécutez la commande suivante, selon votre système d'exploitation :
    • category_manager.bat -d -name FR_POSTAL_CODE sous Windows.
    • ./category_manager.sh -d -name FR_POSTAL_CODE sous Linux.
    Le type FR_POSTAL_CODE a été supprimé de la liste des types reconnus et vous ne pouvez plus associer de numéros contenant cinq chiffres à des codes postaux français lors de la création de modèles de données, dans Talend Data Stewardship.
  5. Répétez cette opération pour supprimer les autres types sémantiques correspondant aux nombres à cinq chiffres :
    • DE_POSTAL_CODE
    • FR_INSEE_CODE

    Lorsque vous supprimez un type sémantique déjà utilisé sur une colonne dans un modèle de données attaché à une campagne, le type sémantique de la colonne est automatiquement configuré à text. Cela signifie que les données pouvant s'afficher comme invalides avec le type sémantique initial peuvent sembler valides avec le type sémantique text.

Résultats

Vous avez supprimé tous les types sémantiques compatibles avec les nombres à cinq chiffres, sauf un. À partir de maintenant, lorsque vous ajoutez de nouveaux modèles de données, vous pouvez configurer le type sémantique US_POSTAL_CODE comme étant le seul type sémantique pour les colonnes contenant des codes postaux.

Pour afficher une liste de toutes les commandes disponibles dans Talend Dictionary Service, allez au niveau <Dictionary_Service_Path>/command-line et saisissez la commande suivante, selon votre système d'exploitatione :
  • category_manager.bat -h commande pour Windows.
  • ./category_manager.sh -h pour Linux.