Nominal - 7.0

Guide utilisateur de Talend Big Data Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
Création et développement
EnrichPlatform
Studio Talend

Les données nominales sont des données catégoriques dont les valeurs/observations peuvent avoir un code assigné, sous forme d'un nombre, où les nombres sont simplement des libellés. Vous pouvez compter les données nominales, mais vous ne pouvez pas les ordonner ou les mesurer.

Dans le studio, le type d'exploration des données textuelles est défini comme nominal. Par exemple, une colonne nommée WEATHER (temps) avec les valeurs : sun (soleil), cloud (nuages) et rain (pluie) est nominale.

Une colonne nommée POSTAL_CODE (code postal) ayant les valeurs 52200 et 75014 est nominale également, malgré ses valeurs numériques. De telles données sont de type nominal car elles identifient un code postal en France. Calculer des quantités mathématiques sur ces données, telles que la moyenne, est un non-sens. Dans un tel cas, vous devrez définir le type de data mining de cette colonne comme nominal, car il est actuellement impossible dans le studio de deviner automatiquement le type correct dans des cas semblables.

C'est également vrai pour les données des clés primaires ou étrangères. Les clés sont souvent représentées par des données numériques, mais leur type de data mining est Nominal.