Statistiques avancées - 8.0

Guide d'utilisation de Talend Big Data Platform Studio

Version
8.0
Language
Français (France)
EnrichDitaval
Big Data Platform
Product
Talend Big Data Platform
Module
Studio Talend
Content
Création et développement

Ils déterminent les valeurs les plus probables ainsi que les plus fréquentes et construisent des tables de fréquence. Les statistiques avancées principales comprennent les valeurs suivantes :

  • Mode : calcule la valeur la plus probable. Pour des données numériques ou continues, vous pouvez définir des intervalles dans les paramètres de cet indicateur. Il est différent des indicateurs "mean" et "median". Il est utile aussi pour traiter des attributs de type nominal.
  • Fréquence de la valeur : calcule le nombre d'enregistrements les plus fréquents pour chaque modèle distinct.
  • Tous les autres indicateurs de fréquence des valeurs sont disponibles afin d'agréger des données selon la "date", la semaine ("week"), le mois ("month"), le trimestre ("quarter"), l'année ("year"), et l'intervalle ("bin").
  • Indicateur de basse fréquence : calcule le nombre d'enregistrements les moins fréquents pour chaque modèle distinct.
  • Tous les autres indicateurs de basse fréquence des valeurs sont disponibles pour chacune des valeurs suivantes : "date", semaine ("week"), mois ("month"), trimestre ("quarter"), année ("year"), et intervalle ("bin") où "bin" est le regroupement des données numériques par intervalle.

Le tableau suivant présente les indicateurs que vous pouvez sélectionner dans n'importe quelle base de données :

Type de données Number Text Date Autres
Type de moteur d'analyse Java SQL Java SQL Java SQL Java SQL
mode
Value (Low) Frequency
Date (Low) Frequency * *
Week (Low) Frequency * *
Month (Low) Frequency * *
Quarter (Low) Frequency * *
Year (Low) Frequency * *
Bin (Low) Frequency
* sauf pour le type de données d'heure