Suppression d'un type sémantique - 6.5

Guide utilisateur de Talend Data Stewardship

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Administration et monitoring > Gestion des utilisateurs
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Installation et mise à niveau
Qualité et préparation de données > Gestion des tâches
EnrichPlatform
Talend Data Stewardship

Vous pouvez supprimer un type sémantique dans Talend Dictionary Service pour le retirer de la liste des types de données reconnus dans Talend Data Stewardship.

Vous pouvez supprimer des types sémantiques et des types standard prédéfinis.

La variété des types sémantiques présents par défaut dans Talend Data Stewardship peut créer des problèmes dans certaines situations. Par exemple, un numéro composé de cinq chiffres peut être interprété comme code postal des États-Unis mais également comme un code postal français ou allemand.

Imaginez que vous travaillez pour une entreprise des États-Unis et que vous devez traiter des données provenant de clients des États-Unis, notamment les codes postaux. Vous pouvez conserver uniquement les codes postaux des États-Unis dans la liste des types sémantiques reconnus.

À l'aide de Talend Dictionary Service, vous allez supprimer les autres types sémantiques correspondant à format des nombres à cinq chiffres et conserver uniquement US_POSTAL_CODE. La modification est instantanément disponible dans Talend Data Stewardship et, à partir de là, vous allez toujours valider une colonne de codes postaux par rapport au type sémantique US_POSTAL_CODE.

Procédure

  1. Ouvrez une invite de commande.
  2. Utilisez la commande cd, allez dans le dossier <Dictionary_Service_Path>/command-line.
  3. Pour afficher les noms des types sémantiques existants et voir lesquels supprimer, exécutez la commande suivante : selon votre système d'exploitation :
    • category_manager.bat -l -type REGEX sous Windows.
    • ./category_manager.sh -l -type REGEX, sous Linux.
    Vos identifiants de connexion à Talend Administration Center vous sont demandés. La commande est exécutée après saisie d'un identifiant et mot de passe valides.

    La liste des types sémantiques basés sur des expressions régulières est affichée. Vous pouvez identifier le nom de ceux à supprimer, FR_POSTAL_CODE ou DE_POSTAL_CODE, entre autres.

  4. Pour supprimer le type sémantique des codes postaux français, exécutez la commande suivante, selon votre système d'exploitation :
    • category_manager.bat -d -name FR_POSTAL_CODE sous Windows.
    • ./category_manager.sh -d -name FR_POSTAL_CODE sous Linux.
    Le type FR_POSTAL_CODE a été supprimé de la liste des types reconnus et vous ne pouvez plus associer de numéros contenant cinq chiffres à des codes postaux français lors de la création de modèles de données, dans Talend Data Stewardship.
  5. Répétez cette opération pour supprimer les autres types sémantiques correspondant aux nombres à cinq chiffres :
    • DE_POSTAL_CODE
    • FR_INSEE_CODE
    Lorsque vous supprimez un type sémantique déjà utilisé sur une colonne dans un modèle de données attaché à une campagne, le type sémantique de la colonne est automatiquement configuré à text. Cela signifie que les données pouvant s'afficher comme invalides avec le type sémantique initial peuvent sembler valides avec le type sémantique text.

Résultats

Vous avez supprimé tous les types sémantiques compatibles avec les nombres à cinq chiffres, sauf un. À partir de maintenant, lorsque vous ajoutez de nouveaux modèles de données, vous pouvez configurer le type sémantique US_POSTAL_CODE comme étant le seul type sémantique pour les colonnes contenant des codes postaux.

Pour afficher une liste de toutes les commandes disponibles dans Talend Dictionary Service, allez au niveau <Dictionary_Service_Path>/command-line et saisissez la commande suivante, selon votre système d'exploitatione :
  • category_manager.bat -h commande pour Windows.
  • ./category_manager.sh -h pour Linux.