Lancer des rapports avancés - 6.3

Talend Data Quality Portal Guide utilisateur et administrateur

EnrichVersion
6.3
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Talend DQ Portal

Des rapports supplémentaires et plus avancés peuvent être lancés uniquement à partir de Talend Data Quality Portal. Ces rapports comprennent des rapports d'intégrité basés sur la liste des tables orphelines et sur les listes de tables sans clé primaire ou sans clé étrangère.

La date et l'heure des rapports avancés sont affichées dans la zone serveur du portail.

Clés primaires potentielles

Ces rapports analysent les données du datamart en utilisant les indicateurs de statistiques simples suivants : row count, distinct count, unique count et duplicate count. Ils cherchent quelles colonnes peuvent être utilisées comme clés primaires.

Prérequis :

  • Vous devez avoir accédé à Talend Data Quality Portal en tant qu'utilisateur.

  • Au moins un rapport doit avoir été généré dans la perspective Profiling du Studio Talend sur une analyse de colonne(s) utilisant les indicateurs de statistiques simples.

Pour lancer un rapport afin de localiser les colonnes pouvant être utilisées comme clés primaires, procédez comme suit :

  1. Dans l'interface Web, cliquez sur l'icône , sélectionnez Reports > Integrity reports, puis cliquez sur Potential PK.

    La page correspondante s'ouvre.

  2. Cliquez dans le champ Header et sélectionnez YES (Oui) si vous souhaitez insérer un logo dans le rapport à lancer.

    Le fichier du logo par défaut est un logo Talend, mais vous pouvez utiliser le logo de votre choix. Pour plus d'informations, consultez Personnalisation des logos dans les rapports.

  3. Cliquez sur la loupe à côté du champ Report pour ouvrir une boîte de dialogue listant certains rapports générés dans la perspective Profiling du Studio Talend.

  4. Sélectionnez le rapport que vous souhaitez analyser afin de rechercher les colonnes pouvant être utilisées comme clés primaires.

  5. Sélectionnez le rapport que vous souhaitez générer puis cliquez sur Confirm dans le coin inférieur droit de la boîte de dialogue.

    Le nom du rapport sélectionné s'affiche dans le champ Report.

  6. Cliquez sur l'icône dans le coin supérieur droit de la page.

    Un indicateur de chargement s'affiche puis un rapport POTENTIAL PRIMARY KEYS s'ouvre dans la page.

    Dans cet exemple, le rapport POTENTIAL PRIMARY KEYS est lancé on the column_client report déjà généré dans la perspective Profiling du Studio Talend. Les résultats montrent qu'une colonne de la table client peut être utilisée en tant que clé primaire.

  7. Dans le coin supérieur droit de la page, cliquez sur l'icône afin de sauvegarder les paramètres du rapport.

    Vous pouvez exécuter un rapport sauvegardé sans avoir à redéfinir ses paramètres. Pour plus d'informations, consultez Accéder à la liste des rapports définis.

Tables orphelines

Ces rapports analysent les données du datamart pour trouver des tables orphelines existant -n'ayant pas de clé d'index. Ils utilisent des analyses d'ensemble (analyses de connexion et de catalogue) pour calculer les résultats.

Prérequis :

  • Vous devez avoir accédé à Talend Data Quality Portal en tant qu'utilisateur.

  • Au moins un rapport doit avoir été généré sur une analyse de connexion ou de catalogue dans la perspective Profiling du Studio Talend.

Pour lancer un rapport afin de localiser les tables orphelines, procédez comme suit :

  1. Dans l'interface Web, cliquez sur l'icône , sélectionnez Reports > Integrity reports, puis cliquez sur Orphan Table.

    La page correspondante s'ouvre.

  2. Cliquez dans le champ Header et sélectionnez YES (Oui) si vous souhaitez insérer un logo dans le rapport à lancer.

    Le fichier du logo par défaut est un logo Talend, mais vous pouvez utiliser le logo de votre choix. Pour plus d'informations, consultez Personnalisation des logos dans les rapports.

  3. Cliquez sur la loupe à côté du champ Report pour ouvrir une boîte de dialogue listant certains rapports générés dans la perspective Profiling du Studio Talend.

  4. Dans la liste Report, sélectionnez le rapport de vue d'ensemble que vous souhaitez analyser, afin de trouver toute table isolée à laquelle aucune autre table ne fait référence.

  5. Sélectionnez le rapport que vous souhaitez générer puis cliquez sur Confirm dans le coin inférieur droit de la boîte de dialogue.

    Le nom du rapport sélectionné s'affiche dans le champ Report.

  6. Cliquez sur Execute, en haut du panneau Parameters.

    Un indicateur de chargement s'affiche et un rapport LIST OF ORPHAN sur le rapport sélectionné s'ouvre dans la page.

    Dans cet exemple, le rapport LIST OF ORPHAN est lancé sur le rapport d'une analyse de contenu d'une base de données. Les résultats montrent le nombre de tables dans chaque schéma ne sont jamais référencées par d'autres tables. Dans cet exemple, dans le catalogue cif, les tables country et customer ne sont pas référencées par d'autres tables.

  7. Dans le coin supérieur droit de la page, cliquez sur l'icône afin de sauvegarder les paramètres du rapport.

    Vous pouvez exécuter un rapport sauvegardé sans avoir à redéfinir ses paramètres. Pour plus d'informations, consultez Accéder à la liste des rapports définis.

Tables sans clé primaire

Ces rapports analysent les données dans le datamart afin de trouver les tables n'ayant pas de clé primaire. Ils utilisant des analyses d'ensemble (connexions et catalogues) pour calculer les résultats.

Prérequis :

  • Vous devez avoir accédé à Talend Data Quality Portal en tant qu'utilisateur.

  • Au moins un rapport doit avoir été généré sur une analyse de connexion ou de catalogue dans la perspective Profiling du Studio Talend.

Pour lancer un rapport afin de localiser les tables n'ayant pas de clé primaire, procédez comme suit :

  1. Dans l'interface Web, cliquez sur l'icône , sélectionnez Reports > Integrity reports, puis cliquez sur Tables without PK.

    La page correspondante s'ouvre.

  2. Cliquez dans le champ Header et sélectionnez YES (Oui) si vous souhaitez insérer un logo dans le rapport à lancer.

    Le fichier du logo par défaut est un logo Talend, mais vous pouvez utiliser le logo de votre choix. Pour plus d'informations, consultez Personnalisation des logos dans les rapports.

  3. Cliquez sur la loupe à côté du champ Report pour ouvrir une boîte de dialogue listant certains rapports générés dans la perspective Profiling du Studio Talend.

  4. Dans la liste Report, sélectionnez le rapport de vue d'ensemble que vous souhaitez analyser, afin de trouver toute table n'ayant pas de clé primaire.

  5. Cliquez sur Confirm dans le coin inférieur droit de la boîte de dialogue.

    Le nom du rapport sélectionné s'affiche dans le champ Report.

  6. Cliquez sur Execute, en haut du panneau Parameters.

    Un indicateur de chargement s'affiche, puis un rapport TABLES WITHOUT PK sur le rapport sélectionné s'affiche dans la page.

    Dans cet exemple, le rapport TABLES WITHOUT PK est lancé sur un rapport d'analyse de contenu d'une base de données. Les résultats montrent le nombre de tables de chaque schéma de la base de données n'ayant pas de clé primaire. Dans le catalogue employee, les tables employee, petalsemployeeoutput et test n'ont pas de clé primaire.

  7. Dans le coin supérieur droit de la page, cliquez sur l'icône afin de sauvegarder les paramètres du rapport.

    Vous pouvez exécuter un rapport sauvegardé sans avoir à redéfinir ses paramètres. Pour plus d'informations, consultez Accéder à la liste des rapports définis.

Tables sans clé étrangère

Ces rapports analysent les données du datamart pour trouver les tables n'ayant pas de clé étrangère. Ils utilisent les analyses d'ensemble (de connexion ou de catalogue) pour calculer les résultats.

Prérequis :

  • Vous devez avoir accédé à Talend Data Quality Portal en tant qu'utilisateur.

  • Au moins un rapport doit avoir été généré sur une analyse de connexion ou de catalogue dans la perspective Profiling du Studio Talend.

Pour lancer un rapport afin de lister les tables n'ayant pas de clé étrangère, procédez comme suit :

  1. Dans l'interface Web, cliquez sur l'icône , sélectionnez Reports > Integrity reports, puis cliquez sur Tables without PK.

    La page correspondante s'ouvre.

  2. Cliquez dans le champ Header et sélectionnez YES (Oui) si vous souhaitez insérer un logo dans le rapport à lancer.

    Le fichier du logo par défaut est un logo Talend, mais vous pouvez utiliser le logo de votre choix. Pour plus d'informations, consultez Personnalisation des logos dans les rapports.

  3. Cliquez sur la loupe à côté du champ Report pour ouvrir une boîte de dialogue listant certains rapports générés dans la perspective Profiling du Studio Talend.

  4. Dans la liste Report, sélectionnez le rapport de vue d'ensemble que vous souhaitez analyser, afin de trouver toute table n'ayant pas de clé étrangère.

  5. Cliquez sur Confirm dans le coin inférieur droit de la boîte de dialogue.

    Le nom du rapport sélectionné s'affiche dans le champ Report.

  6. Cliquez sur Execute en haut du panneau Parameters.

    Un indicateur de chargement s'affiche, puis un rapport TABLES WITHOUT FK sur le rapport sélectionné s'ouvre dans la page.

    Dans cet exemple, le rapport TABLES WITHOUT FK est lancé sur un rapport d'analyse de contenu d'une base de données. Les résultats montrent le nombre de tables dans chaque schéma n'ayant pas de clé étrangère. Par exemple, dans le catalogue crm, les tables contact_tp et cust n'ont pas de clé étrangère.

  7. Dans le coin supérieur droit de la page, cliquez sur l'icône afin de sauvegarder les paramètres du rapport.

    Vous pouvez exécuter un rapport sauvegardé sans avoir à redéfinir ses paramètres. Pour plus d'informations, consultez Accéder à la liste des rapports définis.

Analyse de la taille des colonnes

Ce rapport analyse les données dans le datamart lié à une base de données afin de vérifier les besoins de stockage des données des colonnes spécifiques. Ce rapport met en valeur les colonnes ayant la plus grande différence entre leur taille paramétrée et leur taille maximale actuelle. Cela permet à l'administrateur de paramétrer le serveur de base de données pour réaliser de meilleures performances en s'assurant que l'espace de stockage physique n'est gâché dans aucune des colonnes analysées.

Avertissement

Ce rapport nécessite des analyses de colonnes utilisant des statistiques de texte, principalement les indicateurs de longueur minimale, maximale et moyenne. Vous pouvez générer ce type de rapport uniquement dans Talend Data Quality Portal, c'est-à-dire que vous ne pouvez pas le générer dans la perspective Profiling du Studio Talend.

Prérequis :

  • Vous devez avoir accédé à Talend Data Quality Portal en tant qu'utilisateur.

  • Au moins un rapport d'analyse de colonnes doit avoir été généré dans la perspective Profiling du Studio Talend. L'analyse de colonnes doit utiliser des indicateurs de statistiques de texte, principalement les indicateurs de longueur minimale, maximale et moyenne (Minimal Length, Maximal Length et Average Length).

Pour lancer un rapport afin d'analyser la taille des colonnes dans une base de données spécifique, procédez comme suit :

  1. Dans l'interface Web, cliquez sur l'icône , sélectionnez Reports > Integrity reports, puis cliquez sur Tables without PK.

    La page correspondante s'ouvre.

  2. Cliquez dans le champ Header et sélectionnez YES (Oui) si vous souhaitez insérer un logo dans le rapport à lancer.

    Le fichier du logo par défaut est un logo Talend, mais vous pouvez utiliser le logo de votre choix. Pour plus d'informations, consultez Personnalisation des logos dans les rapports.

  3. Cliquez sur l'icône de loupe du champ CONNECTION, pour afficher une boîte de dialogue listant les connexions à la base de données créées dans la perspective Profiling du Studio Talend.

  4. Dans la liste CONNECTION, sélectionnez la connexion à la base de données utilisée pour effectuer les analyses de colonnes dans la perspective Profiling du Studio Talend.

  5. Cliquez sur Confirm dans le coin inférieur droit de la boîte de dialogue.

    Le nom de la connexion sélectionnée s'affiche dans le champ CONNECTION.

  6. Cliquez sur Execute en haut du panneau Parameters.

    Un indicateur de chargement s'affiche, puis un rapport sur toutes les analyses de colonnes, s'il y en a plusieurs, dans la connexion sélectionnée, s'ouvre dans la page.

    Dans cet exemple, trois rapports ont été générés sur trois analyses de colonnes dans la perspective Profiling du Studio Talend. Le rapport généré dans Talend Data Quality Portal pour la connexion sélectionnée fournit les informations suivantes concernant les colonnes analysées dans les trois analyses différentes :

    Libellé de la colonne

    Description

    COLUMN

    noms des colonnes analysées.

    DISTANCE

    résultats de la soustraction : la longueur maximale (MAX LENGTH) moins la taille de la colonne (COLUMN SIZE). La distance fournit des informations concernant l'espace de stockage utilisé dans la colonne.

    COLUMN SIZE

    longueur des données définie pour la colonne dans la base de données.

    MIN LENGTH

    calcule la longueur minimale du texte dans la colonne.

    AVERAGE LENGTH

    calcule la longueur moyenne du texte dans la colonne.

    MAX LENGTH

    calcule la longueur maximale du texte dans la colonne.

  7. Les résultats affichés dans le rapport permettent à l'Administrateur de réduire les besoins de stockage physique "COLUMN SIZE" pour certaines colonnes et d'économiser de l'espace dans ces colonnes. Cet ajustement de l'espace de stockage des colonnes aura pour effet de réduire le stockage physique dans la table et dans la base de données.