Statistiques simples - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Ils fournissent des statistiques simples sur le nombre d'enregistrements appartenant à certaines catégories, comme le nombre de lignes, le nombre de valeurs nulles, le nombre de valeurs distinctes et uniques, le nombre de valeurs en doublon, ou le nombre de champs blancs.

  • Nombre de blancs : compte le nombre de lignes vides. Un "blanc" est composé de données textuelles non nulles contenant uniquement un espace blanc. Notez qu'Oracle ne fait pas la différence entre une chaîne vide et une valeur nulle.

    Le type de données LONG VARCHAR dans Vertica n'est pas supporté.

  • Nombre de valeurs par défaut : compte le nombre de valeurs par défaut.
  • Compte distinct : compte le nombre de valeurs distinctes de votre colonne.
  • Compte des doublons : compte le nombre de valeurs qui apparaissent plus d'une fois. La relation est la suivante : Compte des doublons + Compte des valeurs uniques = Compte distinct. Par exemple, a,a,a,a,b,b,c,d,e => 9 valeurs, 5 valeurs distinctes, 3 valeurs uniques, 2 valeurs en doublon.
  • Compte nul : compte le nombre de lignes nulles.
  • Compte de lignes : compte le nombre de lignes.
  • Compte des valeurs uniques : compte le nombre de valeurs distinctes avec une seule occurrence. Le compte est forcément inférieur ou égal au compte distinct.

Le tableau suivant présente les indicateurs que vous pouvez sélectionner dans n'importe quelle base de données :

Indicateur Types de données supportés par le moteur d'analyse Java Types de données supportés par le moteur d'analyse SQL
Nombre de lignes Tous les types de données Tous les types de données
Compte null Tous les types de données Tous les types de données
Compte distinct Tous les types de données Tous les types de données
Compte des valeurs uniques Tous les types de données Tous les types de données
Compte des doublons Tous les types de données Tous les types de données
Compte des blancs Text Text
Nombre de valeurs par défaut Tous les types de données, mais uniquement lorsque la table de base de données a une contrainte de valeur par défaut Tous les types de données, mais uniquement lorsque la table de base de données a une contrainte de valeur par défaut