Statistiques avancées - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-04-16
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Ils déterminent les valeurs les plus probables ainsi que les plus fréquentes et construisent des tables de fréquence. Les statistiques avancées principales comprennent les valeurs suivantes :

  • Mode : calcule la valeur la plus probable. Pour des données numériques ou continues, vous pouvez définir des intervalles dans les paramètres de cet indicateur. Il est différent des indicateurs "mean" et "median". Il est utile aussi pour traiter des attributs de type nominal.
  • Fréquence de la valeur : calcule le nombre d'enregistrements les plus fréquents pour chaque modèle distinct.
  • Tous les autres indicateurs de fréquence des valeurs sont disponibles afin d'agréger des données selon la "date", la semaine ("week"), le mois ("month"), le trimestre ("quarter"), l'année ("year"), et l'intervalle ("bin").
  • Indicateur de basse fréquence : calcule le nombre d'enregistrements les moins fréquents pour chaque modèle distinct.
  • Tous les autres indicateurs de basse fréquence des valeurs sont disponibles pour chacune des valeurs suivantes : "date", semaine ("week"), mois ("month"), trimestre ("quarter"), année ("year"), et intervalle ("bin") où "bin" est le regroupement des données numériques par intervalle.

Le tableau suivant présente les indicateurs que vous pouvez sélectionner dans n'importe quelle base de données :

Indicateur Types de données supportés par le moteur d'analyse Java Types de données supportés par le moteur d'analyse SQL
Mode
  • Number
  • Text
  • Date
  • Number
  • Text
  • Date
Value (Low) Frequency
  • Number
  • Text
  • Date
  • Number
  • Text
  • Date
Date (Low) Frequency
  • Date, à l'exception de l'heure
  • Date, à l'exception de l'heure
Week (Low) Frequency
  • Date, à l'exception de l'heure
  • Date, à l'exception de l'heure
Month (Low) Frequency
  • Date, à l'exception de l'heure
  • Date, à l'exception de l'heure
Quarter (Low) Frequency
  • Date, à l'exception de l'heure
  • Date, à l'exception de l'heure
Year (Low) Frequency
  • Date, à l'exception de l'heure
  • Date, à l'exception de l'heure
Bin (Low) Frequency
  • Number
  • Number