Modifier le type sémantique de la colonne de popularité - Cloud

Guide de prise en main de Talend Cloud Data Inventory

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration et monitoring > Gestion des connexions
Gouvernance de données
Qualité et préparation de données > Enrichissement de données
Qualité et préparation de données > Identification de données
Last publication date
2024-03-26

Le type sémantique correspond à la catégorie (noms, e-mails, numéros de téléphone, etc.) des données. Si le type sémantique détecté pour une colonne n'est pas celui souhaité, vous avez la possibilité de le changer manuellement en l'un des types prédéfinis (predefined types), en fonction de votre expérience.

Concernant le jeu de données movies_gsg, vous pouvez voir sur la page Sample (Échantillon) qu'un type a été attribué à chacune des colonnes. Ces types correspondent aux données, par exemple String pour les titres, Date pour les dates de sorties ou Language code iso2 pour la langue originale. Cependant, vous remarquerez que la colonne popularity est marquée comme geographical coordinates (Coordonnées géographiques), ce qui ne correspond pas au contexte réel. La façon dont les données sont formatées correspond à l'écriture de coordonnées, mais vous allez modifier le type pour qu'il corresponde plus au contenu réel de la colonne.

Procédure

  1. Cliquez sur l'en-tête de la colonne popularity.
    Lorsque vous cliquez sur l'icône Edit (Modifier) près du type sémantique dans le panneau de droite, vous pouvez voir le type qui correspond le mieux, geographical coordinates (coordonnées géographiques) dans ce cas, ainsi que les types plus standards, comme Text (Texte), Integer (Integer), Decimal (Décimal) ou Boolean (Booléen). Le type "geographical coordinates" a été attribué automatiquement à cause d'une compatibilité de 99 %, le pourcent manquant venant de la seule valeur invalide de la colonne.
  2. Dans la liste des types disponibles, sélectionnez Decimal.
  3. Recommencez les étapes précédentes pour changer le type de la colonne runtime (durée) en Decimal également.
  4. Cliquez sur Apply 2 changes (Appliquer 2 modifications).

Résultats

Vous avez changé le type sémantique des colonnes popularity et runtime. Étant donné que le type Decimal correspond à 100 % des données de la colonne popularity, la barre de statistiques ne contient plus de orange.