Ajout d'un nouveau type sémantique composé - Cloud

Guide d'utilisation de Talend Cloud Data Inventory

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration et monitoring > Gestion des connexions
Gouvernance de données
Qualité et préparation de données > Enrichissement de données
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Identification de données

Vous pouvez créer un type sémantique composé afin de grouper d'autres types sémantiques publiés sur le serveur de Talend Dictionary Service et l'ajouter à la liste des types de données reconnus.

Vous pouvez mélanger tous les types sémantiques lors de la création d'un type composé. Un type composé peut référencer d'autres types composés si les types enfants sont déjà publiés.

Dans cet exemple, vous devez préparer un fichier contenant des informations relatives à des clients des États-Unis, du Royaume-Uni, d'Allemagne et de France. Une des colonnes de ce jeu de données contient des codes postaux de ces différents pays, donc de différents formats. Dans cette situation, l'application applique le type sémantique correspondant mieux aux valeurs de la colonne, US Postal code par exemple. Les codes postaux allemands, français et britanniques (le reste des données), seront donc considérés comme invalides.

Pour rendre l'application plus adaptée à la situation, vous allez créer un type composé, regroupant les différents types sémantiques utilisés pour valider les codes postaux.

Avant de commencer

Tous les types sémantiques à regrouper dans le type composé ont été publiés.

Procédure

  1. Dans le panneau à gauche de la page d'accueil, ouvrez la vue Semantic type (Type sémantique).
  2. Cliquez sur le bouton Add semantic type (Ajouter une type sémantique).
  3. Dans le champ Name (Nom), saisissez Postal code.
  4. Dans le champ Description (Description), saisissez American, British, German and French postal codes.
  5. Dans la liste Type, sélectionnez Compound type (Type composé).
  6. Laissez l'option Use for validation activée.

    Ce type composé sera utilisé pour définir les valeurs considérées comme bonnes ou mauvaises lors de l'application sur une colonne donnée. Le résultat de ce processus de validation peut être vu dans la barre de statistiques de chaque colonne de vos jeux de données.

    Dans cet exemple, si vous choisissez de désactiver l'option Use for validation, le type composé ne sera utilisé que pour l'exploration de données, et aucune valeur ne sera considérée comme invalide.

  7. Dans la liste déroulante Children types (Types enfants), sélectionnez les types sémantiques à regrouper sous ce type composé Postal code.
  8. Cliquez sur Save and publish (Sauvegarder et publier) pour envoyer le nouveau type composé au serveur de Talend Dictionary Service et le rendre disponible aux utilisateurs et utilisatrices de Talend Cloud Data Inventory.

    Cliquer sur Save as draft (Sauvegarder en tant que brouillon) signifie que le type sémantique sera stocké dans Talend Dictionary Service, mais ne sera pas diffusé dans les applications Talend Cloud. Cela vous permet de choisir le moment auquel vous rendez publics vos types sémantiques.

    Le type Postal code est à présent disponible dans la liste des types sémantiques disponibles, avec le statut Published (Publié).

    Cette modification des types sémantiques est effective instantanément dans Talend Cloud Data Inventory pour chaque nouveau jeu de données que vous créez. Pour les jeux de données existants, vous devez actualiser l'échantillon afin de calculer à nouveau la qualité avec la nouvelle catégorie plus adéquate.

  9. Retournez dans votre jeu de données contenant les codes postaux des différents pays.
  10. Cliquez sur le bouton Refresh sample.

Résultats

Vos données sont mises en correspondance avec le type composé Postal code, manuellement créé dans Talend Dictionary Service. À partir de maintenant, lorsque vous importez de nouveaux jeux de données contenant des codes postaux, ils seront automatiquement mis en correspondance avec le bon type.