Nominal - 6.2

Talend Open Studio for Data Quality Guide utilisateur

EnrichVersion
6.2
EnrichProdName
Talend Open Studio for Data Quality
task
Qualité et préparation de données
EnrichPlatform
Studio Talend

Les données nominales sont des données catégoriques dont les valeurs/observations peuvent avoir un code assigné, sous forme d'un nombre, où les nombres sont simplement des libellés.

Dans le studio, le type d'exploration des données textuelles est défini comme nominal. Par exemple, une colonne nommée WEATHER (temps) avec les valeurs : sun (soleil), cloud (nuages) et rain (pluie) est nominale.

Une colonne nommée POSTAL_CODE (code postal) ayant les valeurs 52200 et 75014 est nominale également, malgré ses valeurs numériques. De telles données sont de type nominal car elles identifient un code postal en France. Calculer des quantités mathématiques sur ces données, telles que la moyenne, est un non-sens. Dans un tel cas, vous devrez définir le type de data mining de cette colonne comme nominal, car il est actuellement impossible dans le studio de deviner automatiquement le type correct dans des cas semblables.

C'est également vrai pour les données des clés primaires ou étrangères. Les clés sont souvent représentées par des données numériques, mais leur type de data mining est Nominal.