Statistiques avancées - 7.1

Guide utilisateur de Talend Data Services Platform Studio

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Services Platform
task
Création et développement
EnrichPlatform
Studio Talend

Ils déterminent les valeurs les plus probables ainsi que les plus fréquentes et construisent des tables de fréquence. Les statistiques avancées principales comprennent les valeurs suivantes :

  • Mode : calcule la valeur la plus probable. Pour des données numériques ou continues, vous pouvez définir des intervalles dans les paramètres de cet indicateur. Il est différent des indicateurs "mean" et "median". Il est utile aussi pour traiter des attributs de type nominal.
  • Fréquence de la valeur : calcule le nombre d'enregistrements les plus fréquents pour chaque modèle distinct.
  • Tous les autres indicateurs de fréquence des valeurs sont disponibles afin d'agréger des données selon la "date", la semaine ("week"), le mois ("month"), le trimestre ("quarter"), l'année ("year"), et l'intervalle ("bin").
  • Indicateur de basse fréquence : calcule le nombre d'enregistrements les moins fréquents pour chaque modèle distinct.
  • Tous les autres indicateurs de basse fréquence des valeurs sont disponibles pour chacune des valeurs suivantes : "date", semaine ("week"), mois ("month"), trimestre ("quarter"), année ("year"), et intervalle ("bin") où "bin" est le regroupement des données numériques par intervalle.