Mise à jour d'un type sémantique existant - Cloud

Guide d'utilisation de Talend Cloud Data Inventory

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration et monitoring > Gestion des connexions
Gouvernance de données
Qualité et préparation de données > Enrichissement de données
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Identification de données

Vous pouvez modifier un type sémantique existant dans Talend Dictionary Service afin de changer la manière dont sont validées vos données dans la vue de l'échantillon dans l'application.

Les types sémantiques prédéfinis se basent sur des valeurs standard, mais il est possible que vous deviez les adapter pour qu'ils correspondent à vos données. Certaines données que vous considérez comme appartenant à une catégorie prédéfinie peuvent être considérées comme invalides.

Prenez l'exemple d'un jeu de données contenant une liste de clients, avec leur adresse e-mail, date de naissance et leur pays de résidence. Vous pouvez constater que toutes les entrées pour America sont considérées comme invalides. Même si effectivement le nom de pays n'est pas valide, c'est la valeur que votre entreprise utilise et vous souhaitez la rendre valide.

Le problème ici est que America n'est pas une valeur attendue pour le type sémantique country dans Talend Dictionary Service. L'entrée valide, dans ce cas, serait United States ou United States of America.

Pour éviter de futurs problèmes, vous allez mettre à jour le type sémantique country dans Talend Dictionary Service et ajouter America à la liste des entrées valides. Cette modification sera automatiquement disponible dans Talend Cloud Data Inventory et dans les autres applications Cloud.

Procédure

  1. Dans le panneau à gauche de la page d'accueil, ouvrez la vue Semantic Type (Type sémantique).
  2. Dans la liste des types sémantiques existants, cliquez sur le type Country pour l'ouvrir.
    Dans cette fenêtre, tous les paramètres du type sémantique peuvent être modifiés, notamment la liste des entrées utilisées pour explorer ou valider des données.
  3. Dans la liste Values (Valeurs), placez votre curseur sur l'entrée United States et cliquez sur l'icône représentant un crayon, à droite.
  4. Après United States, saisissez America comme nouvelle valeur, séparée par une virgule.
  5. Cliquez sur l'icône représentant une coche verte afin de valider votre modification.
    Toutes les valeurs séparées par une virgule au sein de la même ligne sont définies comme des synonymes. En conséquence, America sera considérée comme une valeur valide pour le type sémantique country.
  6. Cliquez sur Save and publish (Sauvegarder et publier) afin de propager la modification dans Talend Dictionary Service et la rendre disponible à tous les utilisateurs et utilisatrices.
    Cette modification du type sémantique est effective instantanément dans Talend Cloud Data Inventory pour chaque nouveau jeu de données que vous créez. Pour les jeux de données existants, vous devez actualiser l'échantillon afin de calculer à nouveau la qualité avec la nouvelle valeur.
  7. Retournez à votre jeu de données avec la colonne contenant les pays des clients.
  8. Cliquez sur le bouton Refresh sample (Actualiser l'échantillon).

Résultats

Le type sémantique country a été mis à jour manuellement pour supporter une nouvelle valeur. Vous pouvez voir que la barre de statistiques sous l'en-tête de la colonne indique qu'il n'y a plus de valeur invalide.

À partir de maintenant, lorsque vous rencontrez des données correspondant au type sémantique country, America sera considéré comme une valeur valide.