Statistiques simples - 8.0

Guide d'utilisation de Talend Big Data Platform Studio

Version
8.0
Language
Français (France)
EnrichDitaval
Big Data Platform
Product
Talend Big Data Platform
Module
Studio Talend
Content
Création et développement

Ils fournissent des statistiques simples sur le nombre d'enregistrements appartenant à certaines catégories, comme le nombre de lignes, le nombre de valeurs nulles, le nombre de valeurs distinctes et uniques, le nombre de valeurs en doublon, ou le nombre de champs blancs.

  • Compte de blancs : compte le nombre de lignes vides. Un "blanc" est composé de données textuelles non nulles contenant uniquement un espace blanc. Notez qu'Oracle ne fait pas la différence entre une chaîne vide et une valeur nulle.

    Le type de données LONG VARCHAR dans Vertica n'est pas supporté.

  • Nombre de valeurs par défaut : compte le nombre de valeurs par défaut.
  • Compte distinct : compte le nombre de valeurs distinctes de votre colonne.
  • Compte des doublons : compte le nombre de valeurs qui apparaissent plus d'une fois. La relation est la suivante : Compte des doublons + Compte des valeurs uniques = Compte distinct. Par exemple, a,a,a,a,b,b,c,d,e => 9 valeurs, 5 valeurs distinctes, 3 valeurs uniques, 2 valeurs en doublon.
  • Compte nul : compte le nombre de lignes nulles.
  • Compte de lignes : compte le nombre de lignes.
  • Compte des valeurs uniques : compte le nombre de valeurs distinctes avec une seule occurrence. Le compte est forcément inférieur ou égal au compte distinct.

Le tableau suivant présente les indicateurs que vous pouvez sélectionner dans n'importe quelle base de données :

Type de données Number Text Date Autres
Type de moteur d'analyse Java SQL Java SQL Java SQL Java SQL
Nombre de lignes
Compte null
Compte distinct
Compte des valeurs uniques
Compte des doublons
Compte des blancs
Nombre de valeurs par défaut * * * * * * * *
*Uniquement lorsque la table de base de données a une contrainte de valeur par défaut