Suppression d'un type sémantique via l'interface - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Vous pouvez supprimer un type sémantique dans Talend Dictionary Service pour le retirer de la liste des types de données reconnus dans Talend Data Preparation.

La variété des types sémantiques présents par défaut dans Talend Data Preparation peut ne pas s'appliquer au contexte de votre entreprise. Par exemple, un nombre composé de cinq chiffres peut être interprété comme un code postal américain, ou comme un code postal français ou allemand, car ils ont le même format.

Imaginez que vous travaillez pour une entreprise des États-Unis et que vous devez traiter des données provenant de clients des États-Unis, notamment les codes postaux. Vous pouvez conserver uniquement les codes postaux des États-Unis dans la liste des types sémantiques reconnus.

Dans cet exemple, la colonne ZIP du jeu de données peut être mise en correspondance avec, au minimum, quatre types.

Via Talend Dictionary Service, vous allez simplement supprimer les autres types sémantiques correspondant au format à cinq chiffres et laisser US Postal Code. Cette modification sera instantanément propagée dans Talend Data Preparation et, à partir de maintenant, les codes postaux seront validés uniquement par rapport au type sémantique US Postal Code.

Procédure

  1. Dans le panneau à gauche de la page d'accueil de Talend Data Preparation, ouvrez la vue Semantic Types (Types sémantiques).
  2. Dans la liste des types sémantique existants, cherchez FR Postal Code.
  3. Pour le supprimer, placez votre curseur sur le type sémantique et cliquez sur l'icône représentant une poubelle, à droite.
  4. Répétez les deux dernières étapes pour supprimer les types FR Insee Code et DE Postal Code.

Résultats

Vous avez supprimé les autres types sémantiques compatibles avec le format à cinq chiffres. À partir de maintenant, lorsque vous ajoutez de nouveaux jeux de données, seul le type US Postal Code sera proposé comme type sémantique pour les colonnes contenant des codes postaux.

Si vous supprimez un type sémantique utilisé dans un ou plusieurs jeux de données, les colonnes correspondantes passeront en catégorie text.