Enrichissement des bibliothèques de types sémantiques via l'interface - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation
Lorsque vous ajoutez un jeu de données, Talend Data Preparation suggère automatiquement un des types sémantiques supportés pour chaque colonne.

Si le type sémantique proposé par Talend Data Preparation pour une colonne n'est pas le type souhaité, vous pouvez le modifier manuellement en cliquant sur l'icône de menu dans l'en-tête de la colonne.

Cela vous permet de choisir parmi les types sémantiques présents dans Talend Data Preparation par défaut. Consultez Types sémantiques prédéfinis pour plus d'informations. Vous pouvez aller plus loin en créant vos propres types sémantiques, ainsi qu'en mettant à jour ou supprimant les types sémantiques existants, afin d'adapter Talend Data Preparation à votre entreprise.

Les modifications des types sémantiques sont faites directement dans l'interface de Talend Data Preparation, via l'onglet Semantic types (Types sémantiques) du menu de gauche.
Toutes les modifications sont stockées à l'aide de Talend Dictionary Service et sont propagées à travers les différents produits Talend.

La disponibilité de Talend Dictionary Service dépend de votre licence.

Dans Talend Dictionary Service, les types sémantiques sont divisés en trois catégories principales :
  • le type DICT, basé sur une liste de valeurs fermée ou ouverte,
  • le type REGEX qui compare vos données par rapport à une expression régulière présélectionnée.
  • le type COMPOUND, sous lequel vous pouvez grouper plusieurs types existants.

Pour permettre les interactions entre Talend Dictionary Service et Talend Data Preparation, vous devez satisfaire les prérequis suivants :

  • Talend Dictionary Service doit être installé et en cours de fonctionnement.
  • Talend Administration Center doit être installé et en cours de fonctionnement.
  • Vous possédez une licence Platform ou Talend Data Fabric.
  • La case Dictionary Service User est cochée pour votre utilisateur dans Talend Administration Center.
  • Dans le fichier <install_folder>\dataprep\config\application.properties, les propriétés dataquality.semantic.update.enable et dataquality.semantic.list.enable sont configurées à true.
  • Dans le fichier <install_folder>\dataprep\config\application.properties, vous avez configuré l'URL de votre instance de Talend Dictionary Service avec le paramètre semanticservice.url.