Le type sémantique correspond à la catégorie (noms, e-mails, numéros de téléphone, etc.) des données. Si le type sémantique détecté pour une colonne n'est pas celui souhaité, vous avez la possibilité de le changer manuellement en l'un des types prédéfinis (predefined types), en fonction de votre expérience.
Concernant le jeu de données movies_gsg, vous pouvez voir sur la page Sample (Échantillon) qu'un type a été attribué à chacune des colonnes. Ces types correspondent aux données, par exemple String
pour les titres, Date
pour les dates de sorties ou Language code iso2
pour la langue originale. Cependant, vous remarquerez que la colonne popularity est marquée comme geographical coordinates (Coordonnées géographiques)
, ce qui ne correspond pas au contexte réel. La façon dont les données sont formatées correspond à l'écriture de coordonnées, mais vous allez modifier le type pour qu'il corresponde plus au contenu réel de la colonne.
Procédure
Résultats
Decimal
correspond à 100 % des données de la colonne popularity, la barre de statistiques ne contient plus de orange.