Suppression d'un type sémantique - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-02-21

Vous pouvez supprimer un type sémantique dans Talend Dictionary Service pour le retirer de la liste des types de données reconnus dans Talend Data Preparation.

La variété des types sémantiques présents par défaut dans Talend Data Preparation peut ne pas s'appliquer au contexte de votre entreprise. Par exemple, un nombre composé de cinq chiffres peut être interprété comme un code postal américain, ou comme un code postal français ou allemand, car ils ont le même format.

Imaginez que vous travaillez pour une entreprise des États-Unis et que vous devez traiter des données provenant de clients des États-Unis, notamment les codes postaux. Il serait plus utile pour vous de conserver uniquement les codes postaux américains dans la liste des types sémantiques reconnus.

Dans cet exemple, la colonne ZIP du jeu de données peut être rapprochée d'au moins quatre types.

Types sémantiques des colonnes Zip (Codes postaux) ouverte.

Via Talend Dictionary Service, vous allez simplement supprimer les autres types sémantiques correspondant au format à cinq chiffres et laisser US Postal Code. Cette modification sera instantanément propagée dans Talend Data Preparation et, à partir de maintenant, les codes postaux seront validés uniquement par rapport au type sémantique US Postal Code.

Procédure

  1. Dans le panneau à gauche de la page d'accueil de Talend Data Preparation, ouvrez la vue Semantic Types (Types sémantiques).
  2. Dans la liste des types sémantique existants, cherchez FR Postal Code.
  3. Pour le supprimer, placez votre curseur sur le type sémantique et cliquez sur l'icône représentant une poubelle, à droite.
  4. Répétez les deux dernières étapes pour supprimer les types FR Insee Code et DE Postal Code.

Résultats

Vous avez supprimé les autres types sémantiques compatibles avec le format à cinq chiffres. À partir de maintenant, lorsque vous ajoutez de nouveaux jeux de données, seul le type US Postal Code sera proposé comme type sémantique pour les colonnes contenant des codes postaux.

Si vous supprimez un type sémantique utilisé dans un ou plusieurs jeux de données, les colonnes correspondantes passeront en catégorie text.