Modifier le type sémantique de la colonne de popularité - Cloud

Guide de prise en main de Talend Cloud Data Inventory

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration et monitoring > Gestion des connexions
Gouvernance de données
Qualité et préparation de données > Enrichissement de données
Qualité et préparation de données > Identification de données

Le type sémantique correspond à la catégorie (noms, e-mails, numéros de téléphone, etc.) des données. Si le type sémantique détecté pour une colonne n'est pas celui souhaité, vous avez la possibilité de le changer manuellement en l'un des types prédéfinis (predefined types), en fonction de votre expérience.

Concernant le jeu de données movies_gsg, vous pouvez voir sur la page Sample (Échantillon) qu'un type a été attribué à chacune des colonnes. Ces types correspondent aux données, par exemple String pour les titres, Date pour les dates de sorties ou Language code iso2 pour la langue originale. Cependant, vous remarquerez que la colonne popularity est marquée comme geographical coordinates (Coordonnées géographiques), ce qui ne correspond pas au contexte réel. La façon dont les données sont formatées correspond à l'écriture de coordonnées, mais vous allez modifier le type pour qu'il corresponde plus au contenu réel de la colonne.

Procédure

  1. Cliquez sur l'icône de menu dans l'en-tête de la colonne popularity.
    Le menu qui s'ouvre alors contient la liste des types les plus susceptibles de correspondre, ici geographical coordinates (coordonnées géographiques), mais également des types plus standards comme Text, Integer, Decimal ou Boolean. Le type "geographical coordinates" a été attribué automatiquement à cause d'une compatibilité de 99 %, le pourcent manquant venant de la seule valeur invalide de la colonne.
  2. Dans la liste des types disponibles, sélectionnez Decimal.
  3. Recommencez les étapes précédentes pour changer le type de la colonne runtime (durée) en Decimal également.

Résultats

Vous avez changé le type sémantique des colonnes popularity et runtime. Étant donné que le type Decimal correspond à 100 % des données de la colonne popularity, la barre de statistiques ne contient plus de orange.