Suppression d'un type sémantique via l'interface - 7.2

Guide d'utilisation de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Vous pouvez supprimer un type sémantique dans Talend Dictionary Service pour le retirer de la liste des types de données reconnus dans Talend Data Preparation.

La variété des types sémantiques présents par défaut dans Talend Data Preparation peut ne pas s'appliquer au contexte de votre entreprise. Par exemple, un nombre composé de cinq chiffres peut être interprété comme un code postal américain, ou comme un code postal français ou allemand, car ils ont le même format.

Imaginez que vous travaillez pour une entreprise des États-Unis et que vous devez traiter des données provenant de clients des États-Unis, notamment les codes postaux. Il serait plus utile pour vous de conserver uniquement les codes postaux américains dans la liste des types sémantiques reconnus.

Dans cet exemple, la colonne ZIP du jeu de données peut être mise en correspondance avec, au minimum, quatre types.

Via Talend Dictionary Service, vous allez simplement supprimer les autres types sémantiques correspondant au format à cinq chiffres et laisser US Postal Code. Cette modification sera instantanément propagée dans Talend Data Preparation et, à partir de maintenant, les codes postaux seront validés uniquement par rapport au type sémantique US Postal Code.

Procédure

  1. Dans le panneau à gauche de la page d'accueil de Talend Data Preparation, ouvrez la vue Semantic Types (Types sémantiques).
  2. Dans la liste des types sémantique existants, cherchez FR Postal Code.
  3. Pour le supprimer, placez votre curseur sur le type sémantique et cliquez sur l'icône représentant une poubelle, à droite.
  4. Répétez les deux dernières étapes pour supprimer les types FR Insee Code et DE Postal Code.

Résultats

Vous avez supprimé les autres types sémantiques compatibles avec le format à cinq chiffres. À partir de maintenant, lorsque vous ajoutez de nouveaux jeux de données, seul le type US Postal Code sera proposé comme type sémantique pour les colonnes contenant des codes postaux.

Si vous supprimez un type sémantique utilisé dans un ou plusieurs jeux de données, les colonnes correspondantes passeront en catégorie text.