Description détaillée des tables - 6.2

Talend Real-time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.2
EnrichProdName
Talend Real-Time Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Les rapports sont des agrégations d'analyses. Un rapport complet sera composé de plusieurs lignes (autant de lignes que d'analyses contenues dans le rapport).

TDQ_ANALYSIS

  • AN_PK : clé primaire artificielle.

  • AN_UUID : identifiant de l'analyse.

  • AN_LABEL : nom de l'analyse.

  • AN_CREATION_DATE : date de création de l'analyse.

  • AN_AUTHOR : auteur de l'analyse.

  • AN_DATA_FILTER : filtre des données de l'analyse.

  • AN_STATUS : statut de l'analyse.

  • REP_UUID : identifiant du rapport.

  • REP_CREATION_DATE : date de création du rapport.

  • REP_LABEL : nom du rapport.

  • REP_AUTHOR : auteur du rapport.

  • REP_STATUS : statut du rapport.

  • AN_BEGIN_DATE : date de création de la ligne.

  • AN_END_DATE : date indiquant un changement des attributs de la paire (rapport/analyse).

  • AN_VERSION : numéro de la version du rapport ou de l'analyse, incrémenté à chaque modification des données de la paire.

  • AN_PURPOSE : objectif de l'analyse.

  • AN_DESCRIPTION:  description de l'analyse.

  • REP_PURPOSE : objectif du rapport.

  • REP_DESCRIPTION : description du rapport.

  • AN_TYPE : type d'analyse.

TDQ_ANALYZED_ELEMENT

  • ELT_PK : clé primaire (artificielle).

  • ELT_UUID : identifiant de l'élément analysé.

  • ELT_CONNECTION_UUID : identifiant de la connexion.

  • ELT_CONNECTION_NAME : nom de la connexion.

  • ELT_CATALOG_NAME : nom du catalogue ou valeur de Talend par défaut correspondant à une valeur null (voir SqlConstants.java).

  • ELT_SCHEMA_NAME : nom du schéma ou valeur de Talend par défaut correspondant à une valeur null (voir SqlConstants.java).

  • ELT_TABLE_NAME : nom de la table ou valeur de Talend par défaut correspondant à une valeur null (voir SqlConstants.java).

  • ELT_COLUMN_NAME : nom de la colonne ou valeur de Talend par défaut correspondant à une valeur null (voir SqlConstants.java).

  • ELT_BEGIN_DATE : colonnes d'historisation.

  • ELT_END_DATE : colonnes d'historisation.

  • ELT_VERSION : colonnes d'historisation.

  • ELT_CONNECTION_URL : URL de connexion à la base de données contenant l'élément analysé.

  • ELT_SIZE : taille des colonnes analysées.

  • ELT_PROJECT_NAME : nom du projet actuel.

  • ELT_PROJECT_DESCRIPTION : description du projet actuel.

  • ELT_CTX_GROUP_ID : identifiant du groupe de contextes.

  • ELT_CTX_GROUP_NAME : nom du groupe de contextes.

  • ELT_CTX_NAME : nom du contexte.

TDQ_ANALYZED_SET

  • AN_SET_PK : clé primaire artificielle.

  • MATCH_IND_PK : ID de l'indicateur de correspondance pour les ensembles A et B.

  • ELT_A_PK : élément appartenant à l'ensemble A de l'indicateur de correspondance.

  • ELT_B_PK : élément appartenant à l'ensemble B de l'indicateur de correspondance.

TDQ_CALENDAR

  • CAL_PK : clé primaire.

  • CAL_DATE : date.

  • CAL_DAY_IN_MONTH : jour du mois

  • CAL_DAY_IN_YEAR : jour de l'année.

  • CAL_LAST_WEEK_DAY : dernier jour de la semaine courant (CAL_DAY_IN_YEAR) de l'année.

  • CAL_LAST_MONTH_DAY : dernier jour du mois courant (CAL_DAY_IN_YEAR) de l'année.

  • CAL_WEEK_DAY : jour de la semaine.

  • CAL_DAY_NAME : nom du jour.

  • CAL_WEEK_NUM : numéro de la semaine.

  • CAL_WEEK_PERIOD : période (yyyyww) où (y) est l'année, (w) le numéro de la semaine.

  • CAL_MONTH : numéro du mois.

  • CAL_MONTH_NAME : nom du mois.

  • CAL_YEAR : année.

  • CAL_MONTH_PERIOD : chaîne de caractères représentant la période : (yyyymm).

  • CAL_QUARTER : trimestre 1,2,3 ou 4.

  • CAL_QUARTER_PERIOD : période (yyyyq) où (y) est l'année, (q) le trimestre 1,2,3 ou 4.

  • CAL_SEMESTER : semestre (1 ou 2).

  • CAL_SEMESTER_PERIOD : période (yyyys) où (y) est l'année, (s) le semestre.

  • CAL_DAY_OFF : flag indiquant les jours chômés.

  • CAL_SPECIAL_DAY : flag indiquant les dates spéciales, Y indiquant un jour spécial, N indiquant que le jour n'est pas spécial.

  • CAL_SPEC_DAY_LABEL: libellé du jour spécial.

TDQ_DAY_TIME

L'information de temps est stockée au format UTC (Temps Universel Coordonné).

  • TIME_PK : clé primaire (artificielle).

  • TIME_HOUR : heure (0-23).

  • TIME_MINUTES : minutes (0-59).

  • TIME_LABEL : libellé du temps.

TDQ_INDICATOR_DEFINITION

  • IND_PK : clé primaire (artificielle).

  • IND_LABEL : libellé de l'indicateur.

  • IND_UUID : identifiant de l'indicateur.

  • IND_CATEGORY : catégorie de l'indicateur. Les indicateurs simples, comme les indicateurs de compte appartiennent à la catégorie Simple Statistics, sous-catégorie Count. Les indicateurs de texte appartiennent à la catégorie Text Statistics. Les indicateurs de moyenne, de médiane, de quartile inférieur, de quartile supérieur, de valeur minimale, de valeur maximale appartiennent à la catégorie Summary Statistics. L'indicateur de mode appartient à la catégorie Advanced Statistics et à la sous-catégorie Mode. L'indicateur de table de fréquence appartient à la catégorie Advanced Statistics et à la sous-catégorie Frequencies.

  • IND_CATEG_UUID : identifiant de la catégorie.

  • IND_CRITICAL : niveau de criticité de l'indicateur.

  • IND_PURPOSE : objectif de l'indicateur.

  • IND_DESCRIPTION : description de l'indicateur.

Et les trois colonnes d'historisation :

  • IND_BEGIN_DATE

  • IND_END_DATE

  • IND_VERSION

TDQ_INDICATOR_OPTIONS

  • INO_PK : clé primaire (artificielle).

  • INO_CASE_SENSITIVE : flag sensible à la casse Y, N, U.

  • INO_REGEXP : expression régulière.

  • INO_COUNT_NULLS : flag pour compter les valeurs null Y, N.

  • INO_COUNT_BLANKS : flag pour compter les valeurs vides Y, N.

TDQ_INDICATOR_VALUE

  • INDV_PK : clé primaire (artificielle).

  • TIME_PK : clés étrangères des tables de dimension temporelle.

  • ELEMENT_PK : clés étrangères des tables de dimension des éléments analysés.

  • ANALYSIS_PK : clés étrangères de la table de dimension d'analyse.

  • VALUE_PK : clés étrangères de la valeur des tables de dimension.

  • OPTION_PK : clés étrangères de l'option des tables de dimension.

  • INDICATOR_PK : clés étrangères de la définition de l'indicateur des tables de dimension.

  • CALENDAR_PK : clés étrangères de la date des tables de dimension.

  • IND_TYPE : type d'exploration des données (data mining).

  • AN_DURATION : durée de l'analyse.

  • AN_RUNTIME : date d'exécution de l'analyse.

  • INDV_REAL_VALUE : valeur réelle de l'indicateur.

  • INDV_INT_VALUE : valeur entière de l'indicateur.

  • INDV_ROW_COUNT : nombre de lignes à l'évaluation de cet indicateur.

  • INDV_VALUE_TYPE_INDICATOR : flag indiquant si l'indicateur est un indicateur de valeur réelle.

  • INDV_DTHRESH_OK : les flags Y, N et U indiquent si l'indicateur respecte le seuil sur les données. Y signifie oui (yes), N signifie non, U signifie indéfini (undefined).

  • INDV_DTHRESH_LOW : valeur inférieure du seuil sur les données.

  • INDV_DTHRESH_HI : valeur supérieure du seuil sur les données.

  • INDV_ITHRESH_OK : les flags Y, N et U indiquent si l'indicateur respecte le seuil sur l'indicateur. Y signifie oui (yes), N signifie non, U signifie indéfini (undefined).

  • INDV_ITHRESH_LOW : valeur inférieure du seuil sur l'indicateur.

  • INDV_ITHRESH_HI : valeur supérieure du seuil sur l'indicateur.

  • INDV_EXP_VAL_OK : les flags Y, N et U indiquent si l'indicateur respecte la valeur attendue de l'indicateur. Y signifie oui (yes), N signifie non, U signifie indéfini (undefined).

  • INDV_EXP_VAL : valeur attendue de l'indicateur.

  • INDV_ITHRESH_PERC_OK : les flags Y, N et U indiquent si l'indicateur respecte le pourcentage défini du seuil. Y signifie oui (yes), N signifie non, U signifie indéfini (undefined).

  • INDV_ITHRESH_PERC_LOW : seuil inférieur de la valeur de l'indicateur, en pourcentage, relatif au nombre total de lignes.

  • INDV_ITHRESH_PERC_HI : seuil supérieur de la valeur de l'indicateur, en pourcentage, relatif au nombre total de lignes.

  • INDV_DATE_VALUE : stocke la valeur de date de l'indicateur.

  • INDV_IDATETHRESH_LO : stocke le seuil inférieur sur la date.

  • INDV_IDATETHRESH_HI : stocke le seuil supérieur sur la date.

  • INDV_IDATETHRESH_OK : les flags Y, N et U indiquent si l'indicateur respecte le seuil sur la date. Y signifie oui (yes), N signifie non, U signifie indéfini (undefined).

  • REP_DURATION : durée du rapport.

  • REP_RUNTIME : date d'exécution du rapport.

TDQ_MATCH_INDVALUE

  • M_PK : clé primaire.

  • OPTION_PK :référence aux options.

  • ANALYSIS_PK : clé étrangère de la table de dimension d'analyse.

  • TABLE_A_PK:  clé étrangère de la table contenant l'ensemble A.

  • TABLE_B_PK : clé étrangère de la table contenant l'ensemble B.

  • INDICATOR_PK : clé étrangère de la définition de l'indicateur.

  • AN_DURATION : durée de l'exécution de l'analyse.

  • TIME_PK : clé étrangère de l'heure d'exécution de l'analyse.

  • CALENDAR_PK : clé étrangère de la date d'exécution de l'analyse.

  • AN_RUNTIME : date d'exécution de l'analyse.

  • INDV_MATCH_PERCENT : pourcentage des valeurs correspondantes.

  • INDV_MATCH_COUNT : nombre de valeurs correspondantes.

  • INDV_ROW_COUNT : nombre total de lignes.

  • INDV_DTHRESH_OK : les flags Y, N et U indiquent si l'indicateur respecte le seuil sur les données. Y signifie oui (yes), N signifie non, U signifie indéfini (undefined).

  • INDV_DTHRESH_LOW : valeur inférieure du seuil sur les données.

  • INDV_DTHRESH_HI : valeur supérieure du seuil sur les données.

  • INDV_ITHRESH_OK : les flags Y, N et U indiquent si l'indicateur respecte le seuil de l'indicateur. Y signifie oui (yes), N signifie non, U signifie indéfini (undefined).

  • INDV_ITHRESH_LOW : valeur inférieure du seuil sur l'indicateur.

  • INDV_ITHRESH_HI : valeur supérieure du seuil sur l'indicateur.

  • INDV_EXP_VAL_OK : les flags Y, N et U indiquent si l'indicateur respecte la valeur attendue de l'indicateur. Y signifie oui (yes), N signifie non, U signifie indéfini (undefined).

  • INDV_EXP_VAL : valeur attendue de l'indicateur.

  • REP_DURATION : durée du rapport.

  • REP_RUNTIME : date d'exécution du rapport.

TDQ_OVERVIEW_INDVALUE

  • TV_PK : clé primaire (clé technique).

  • AN_PK : clé étrangère de l'analyse.

  • CAL_PK : clé étrangère de la date d'exécution de l'analyse.

  • TIME_PK : clé étrangère de l'heure d'exécution de l'analyse.

  • IND_PK : clé étrangère de la définition de l'indicateur.

  • ELT_PK : clé étrangère de l'élément analysé (pour les tables, l'élément analysé référence le schéma ou le catalogue parent)

  • TV_NAME : table de nom View. Peut être vide lorsque la ligne représente le niveau du schéma, du catalogue ou de la connexion.

  • TV_CATALOGCOUNT : nombre de catalogues.

  • TV_SCHEMACOUNT : nombre de schémas.

  • TV_TABLECOUNT : nombre de tables.

  • TV_ROWCOUNT : nombre de lignes dans les tables.

  • TV_KEYCOUNT : nombre de clés.

  • TV_INDEXCOUNT : nombre d'indices.

  • TV_TRIGGERCOUNT : nombre de déclencheurs.

  • TV_VIEWCOUNT : nombre de vues (0 ou 1).

  • TV_TABLE_FILTER : filtre de table utilisé dans l'analyse.

  • TV_VIEW_FILTER : filtre de vue utilisé dans l'analyse.

  • AN_RUNTIME TIMESTAMP : date d'exécution de l'analyse.

  • AN_DURATION : durée de l'analyse (ms).

  • REP_DURATION : durée du rapport.

  • REP_RUNTIME : date d'exécution du rapport.

TDQ_SET_INDVALUE

  • SET_INDV_PK : clé primaire (artificielle).

  • TIME_PK : clé étrangère pour la table dimensionnelle TDQ_DAY_TIME.

  • CAL_PK : clé étrangère pour la table calendrier dimensionnelle.

  • AN_PK : clé étrangère pour la table dimensionnelle TDQ_ANALYSIS.

  • IND_PK : clé étrangère pour la table TDQ_INDICATOR_DEFINITION.

  • SIV_INT_VALUE : valeur de l'indicateur de compte.

  • AN_DURATION : durée de l'analyse.

  • AN_RUNTIME : date d'exécution de l'analyse.

  • VERSION : référence au numéro de version dans la table TDQ_TABLE_ANALYZED_SET.

  • SIV_ROW_COUNT : nombre total de lignes.

  • SIV_THRESH_OK : les flags Y, N et U indiquent si l'indicateur respecte le seuil de l'indicateur. Y signifie oui (yes), N signifie non, U signifie indéfini (undefined).

  • SIV_THRESH_LOW : valeur inférieure de l'indicateur du seuil.

  • SIV_THRESH_HI : valeur inférieure de l'indicateur du seuil.

  • SIV_THRESH_PERC_OK : les flags Y, N et U indiquent si l'indicateur respecte le pourcentage défini du seuil. Y signifie oui (yes), N signifie non, U signifie indéfini (undefined).

  • SIV_THRESH_PERC_LOW : seuil inférieur de la valeur de l'indicateur en pourcentage relatif au nombre total de lignes.

  • SIV_THRESH_PERC_HI : seuil supérieur de la valeur de l'indicateur en pourcentage relatif au nombre total de lignes.

  • TABLE_PK : référence à la table contenant les éléments analysés.

  • IND_PARENT_PK : lien entre l'indicateur enfant et son indicateur parent.

  • ELT_PK : lien vers la colonne.

  • REP_DURATION : durée du rapport.

  • REP_RUNTIME : date d'exécution du rapport.

TDQ_VALUES

  • VAL_PK : clé primaire (artificielle)

  • VAL_STRING : valeur (parmi les valeurs possibles dans les tables de fréquence)

TDQ_PRODUCT

  • PR_VERSION : contient le numéro de version de la sortie de TDQ.

TDQ_TABLE_ANALYZED_SET

  • AN_SET_PK : clé primaire.

  • VERSION : version de l'analyse déterminée par les variations de l'ensemble de colonnes.

  • ELT_PK : clé étrangère pour la table dimensionnelle TDQ_ANALYZED_ELEMENT.

  • AN_PK : clé étrangère pour la table dimensionnelle TDQ_ANALYSIS.

TDQ_MIGRATION

  • ID : clé primaire (artificielle).

  • MIGRATION_NAME : nom de la migration.

  • PREVIOUS_VERSION : version antérieure du produit.

  • UPDATE_VERSION : version mise à jour du produit.

  • MIGRATION_DATE : date de la migration.