Statistiques de texte - 7.0

Guide utilisateur de Talend Data Management Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Management Platform
task
Création et développement
EnrichPlatform
Studio Talend

Vous pouvez définir les indicateurs de statistiques de texte sur une colonne uniquement si son type de data mining est nominal. Sinon, ces indicateurs sont grisés dans la boîte de dialogue [Indicator Selection]. Pour plus d'informations concernant les types de data mining disponibles, consultez Types de data mining.

Les statistiques de texte permettent d'analyser les caractéristiques des champs textuels dans les colonnes, y compris les longueurs minimale, maximale et moyenne.

  • Longueur minimale : calcule la longueur minimale d'un champ de texte non-nul et non-vide.

  • Longueur maximale : calcule la longueur maximale d'un champ de texte non-nul et non-vide.

  • Longueur moyenne : calcule la longueur moyenne d'un champ de texte non-nul et non-vide.

D'autres indicateurs de statistiques de texte sont disponibles, permettant de calculer les mêmes longueurs que les indicateurs ci-dessus, mais en prenant en compte les valeurs nulles, ou les valeurs blanches, ou les valeurs nulles et blanches.

Les valeurs nulles seront comptées comme des données de longueur 0, autrement dit la longueur minimale des valeurs nulles est 0. Cela signifie que le Minimal Length With Null et le Maximal Length With Null calculeront la longueur minimale/maximale d'un champ textuel comprenant des valeurs nulles.

Les valeurs blanches seront comptées comme des données régulières de longueur 0, autrement dit la longueur minimale des valeurs blanches est 0. Cela signifie que le Minimal Length With Blank et le Maximal Length With Blank calculeront la longueur minimale/maximale d'un champ textuel comprenant des valeurs blanches.

Le même principe s'applique pour tous les indicateurs des longueurs moyennes.

Le tableau ci-dessous donne un exemple de calcul de la longueur d'un champ textuel dans une colonne en utilisant tous les types d'indicateurs de statistiques de texte.

Valeur Par exemple, calculez la longueur de champs textuels dans une colonne contenant les valeurs suivantes, en utilisant tous les types d'indicateurs de statistiques de texte :
"Brayan" 6
"Ava" 3
"_" 1
"" 0
<null> <null>
"__________" 10
Remarque : "_" représente une espace.
Vous obtiendrez les résultats suivants :