MPD implémenté - 6.1

Talend MDM Platform Studio Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend MDM Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Vous pouvez utiliser le Modèle Physique des Données (MPD) de la solution de pour créer vos propres rapports spécifiques avec l'outil JasperReports, et les utiliser lorsque vous créez des rapports personnalisés dans le studio.

L'interface de la solution de inclut des tables de faits et de dimension.

Tables de faits :

  • TDQ_INDICATOR_VALUE : valeur de l'indicateur.

  • TDQ_OVERVIEW_INDVALUE : analyses d'ensemble.

  • TDQ_MATCH_INDVALUE : analyses de comparaison.

  • TDQ_SET_INDVALUE : analyses d'un ensemble de colonnes.

Les tables de faits doivent contenir des colonnes ayant les valeurs suivantes : NULL (TALEND), N/A (TDQ) et EMTPY (TDQ). La valeur NULL (TALEND) indique que les données analysées sont nulles. La valeur N/A (TDQ) indique que ça n'a pas de sens d'avoir une valeur dans cette colonne. La valeur EMPTY (TDQ) indique que les données analysées sont vides (une chaîne de caractères vide est différente d'une valeur nulle dans la plupart des bases de données).

Tables de dimension :

  • TDQ_ANALYSIS : instance d'analyse dans un rapport (ce qui signifie que la clé fonctionnelle est formée de l'ID du rapport et de l'ID de l'analyse).

  • TDQ_INDICATOR_DEFINITION : définition d'indicateur (nombre de lignes, table de fréquence...).

  • TDQ_ANALYZED_ELEMENT : élément analysé (généralement une colonne).

  • TDQ_DAY_TIME : dimension du temps, de la journée (heures, minutes).

    L'information de temps est stockée au format UTC (Temps Universel Coordonné).

  • TDQ_VALUE : table listant les valeurs lorsque l'indicateur de la table de fréquence est calculé.

  • TDQ_INDICATOR_OPTIONS : options utilisées par les indicateurs.

  • TDQ_CALENDAR : dimension de la date.

  • TDQ_ANALYZED_SET : table de mapping entre l'indicateur et les ensembles d'éléments analysés, analyses de comparaison de colonnes.

  • TDQ_INDICATOR_Value : valeur de l'indicateur.

  • TDQ_MATCH_INDValue : table de faits des analyses de comparaison.

  • TDQ_OVERVIEW_INDValue : table de faits pour les indicateurs de vue d'ensemble des tables, schémas et catalogues.

  • TDQ_PRODUCT : informations concernant la plateforme TDQ utilisée.

  • TDQ_SET_INDValue : table de faits des indicateurs mesurant un ensemble de colonnes.

  • TDQ_TABLE_ANALYZED_SET : table de relations pour TDQ_ANALYZED_ELEMENT et TDQ_SET_INDValue.

Comme les données des tables de dimension évoluent lentement, l'historique des données est suivi par la création de multiples enregistrements dans les tables dimensionnelles avec des clés séparées. De nouveaux enregistrements sont insérés à chaque fois qu'une modification est apportée. Pour plus d'informations, consultez http://en.wikipedia.org/wiki/Slowly_changing_dimension#Type_2 (en anglais).

Les tables de dimension peuvent contenir des colonnes ayant les valeurs suivantes : NULL (TALEND), N/A (TDQ) et EMTPY (TDQ). La valeur NULL (TALEND) indique que les données analysées sont nulles. La valeur N/A (TDQ) indique que ça n'a pas de sens d'avoir une valeur dans cette colonne dans un contexte de qualité de données. La valeur EMPTY (TDQ) indique que les données analysées sont vides (une chaîne de caractères vide est différente d'une valeur nulle dans la plupart des bases de données).

La capture d'écran ci-dessous vous montre la manière dont est conçu le MPD de la solution de ainsi que l'interconnectivité de ses tables.

Les captures d'écran suivantes illustrent des parties du MPD concernant les analyses de comparaison, les analyses d'ensemble et les analyses d'un ensemble de colonnes.