Accéder au contenu principal

Enrichissement des bibliothèques de types sémantiques

Lorsque vous ajoutez un jeu de données, Talend Data Preparation suggère automatiquement, pour chaque colonne, le type de données ou le type sémantique qui correspond le mieux aux données.

Si le type sémantique proposé par Talend Data Preparation pour une colonne n'est pas le type souhaité, vous pouvez le modifier manuellement en cliquant sur la flèche blanche dans l'en-tête de la colonne.

Cela vous permet de choisir parmi les types sémantiques présents dans Talend Data Preparation par défaut. Pour plus d'informations, consultez Types sémantiques prédéfinis (uniquement en anglais). Vous pouvez aller plus loin en créant vos propres types sémantiques, ainsi qu'en mettant à jour ou supprimant les types sémantiques existants, afin d'adapter Talend Data Preparation à votre entreprise.

Les modifications des types sémantiques sont faites directement dans l'interface de Talend Data Preparation, via l'onglet Semantic types (Types sémantiques) du menu de gauche.
Toutes les modifications sont stockées à l'aide de Talend Dictionary Service et sont propagées à travers les différents produits Talend.

La disponibilité de Talend Dictionary Service dépend de votre licence.

Dans Talend Dictionary Service, les types sémantiques sont divisés en trois catégories principales :
  • le type DICT, basé sur une liste de valeurs fermée ou ouverte,
  • le type REGEX qui compare vos données par rapport à une expression régulière présélectionnée,
  • le type COMPOUND, sous lequel vous pouvez grouper plusieurs types existants.

Pour permettre les interactions entre Talend Dictionary Service et Talend Data Preparation, vous devez satisfaire les prérequis suivants :

  • Talend Dictionary Service doit être installé et en cours d'exécution.
  • Talend Administration Center doit être installé et en cours de fonctionnement.
  • Vous possédez une licence Platform ou Talend Data Fabric.
  • La case Dictionary Service User est cochée pour votre utilisateur·rice dans Talend Administration Center.
  • Dans le fichier <install_folder>\dataprep\config\application.properties, les propriétés dataquality.semantic.update.enable et dataquality.semantic.list.enable sont configurées à true.
  • Dans le fichier <install_folder>\dataprep\config\application.properties, vous avez configuré l'URL de votre instance de Talend Dictionary Service avec le paramètre semanticservice.url.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !