Accéder au contenu principal

Enrichir des types sémantiques dans Data Stewardship

Talend Dictionary Service stocke les catégories sémantiques utilisées dans plusieurs produits Talend, notamment Talend Cloud Data Stewardship. Vous pouvez enrichir ces types sémantiques avec vos catégories personnelles. Toutes les modifications sont instantanément disponibles. Cependant, la disponibilité de Talend Dictionary Service dépend de votre licence.
Note InformationsRemarque : Vous pouvez charger jusqu'à 10 Mo de contenu dans Talend Dictionary Service par tenant.
Pour permettre les interactions entre Talend Dictionary Service et Talend Cloud Data Stewardship, vous devez satisfaire les prérequis suivants :
  • Votre licence dans doit inclure la qualité de données (Data Quality), c'est-à-dire à partir de Data Management.
  • votre utilisateur·rice Talend Cloud doit avoir le rôle Semantic types manager de l’application Dictionary service assigné dans Talend Cloud Data Stewardship, en plus de ses rôles Talend Cloud Data Stewardship.
Note InformationsRemarque : Si vous utilisez une version d'évaluation de Talend Cloud Data Stewardship, la gestion des types sémantiques ne sera pas disponible.

Lorsque des gestionnaires de campagnes définissent la structure des données à gérer dans une campagne, ils peuvent sélectionner parmi une liste prédéfinie le type sémantique de chaque attribut. Lorsqu'ils chargent des données dans Talend Cloud Data Stewardship, une validation interne du type de schéma est effectuée et les données sont affichées comme valides ou invalides.

Données valides et invalides dans une campagne.

Par exemple, la liste des entrées comprises par défaut dans l'application sous les pays ne comprend pas Republic of Angola et UK. Par conséquent, ces entrées sont considérées comme des noms de pays invalides lors du chargement dans Talend Cloud Data Stewardship.

Vous pouvez toutefois créer vos propres types sémantiques, ainsi que mettre à jour ou supprimer les types existants, afin que votre expérience avec Talend Cloud Data Stewardship soit adaptée à votre entreprise. Vous pouvez effectuer toutes ces options de gestion via une interface intégrée.

Lorsque vous créez des types sémantiques, vous pouvez décider de les utiliser pour la validation de données ou la découverte de données :
  • la validation de données rapproche les données par rapport à des types sémantiques et marque les données comme valides ou invalides ;
  • la découverte de données permet d'explorer les catégories sémantiques et d'interroger les relations sémantiques complexes dans les données analysées et d'écrire en sortie les résultats du rapprochement pour afficher les concepts les plus pertinents.

Talend Cloud Data Stewardship utilise les types sémantiques uniquement pour la validation, comme aucune découverte de données n'est effectuée de son côté.

Sur le serveur, les types sémantiques sont divisés en plusieurs catégories :
  • Le type Dictionary qui est basé sur une liste de valeurs fermée.
  • le type Regular expression, qui compare vos données à une expression régulière présélectionnée,
  • le type Compound type, qui compare vos données à différents types sémantiques référencés dans le type composé.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !