Analyse de la taille des colonnes - 7.3

Guide d'utilisation et d'admininstration de Talend Data Quality Portal (déprécié)

Version
7.3
Language
Français (France)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend DQ Portal
Content
Gouvernance de données
Qualité et préparation de données

Pourquoi et quand exécuter cette tâche

Ce rapport analyse les données dans le datamart lié à une base de données afin de vérifier les besoins de stockage des données des colonnes spécifiques. Ce rapport met en valeur les colonnes ayant la plus grande différence entre leur taille paramétrée et leur taille maximale. Cela permet à l'administrateur·trice de paramétrer le serveur de base de données pour réaliser de meilleures performances en s'assurant que l'espace de stockage physique n'est gâché dans aucune des colonnes analysées.

Avertissement : Ce rapport nécessite des analyses de colonnes utilisant des statistiques de texte, principalement les indicateurs de longueur minimale, maximale et moyenne (Minimal Length, Maximal Length et Average Length). Vous pouvez générer ce type de rapport uniquement dans Talend DQ Portal, c'est-à-dire que vous ne pouvez pas le générer dans la perspective Profiling du Studio Talend.
Prérequis :
  • Vous devez avoir accédé à Talend DQ Portal en tant qu'utilisateur ou utilisatrice.

  • Au moins un rapport d'analyse de colonnes doit avoir été généré dans la perspective Profiling du Studio Talend. L'analyse de colonnes doit utiliser des indicateurs de statistiques de texte, principalement les indicateurs de longueur minimale, maximale et moyenne (Minimal Length, Maximal Length et Average Length).

Pour lancer un rapport afin d'analyser la taille des colonnes dans une base de données spécifique, procédez comme suit :

Procédure

  1. Dans l'interface, cliquez sur l'icône , placez votre curseur sur Reports > Integrity reports puis cliquez sur Column size analysis.i

    Exemple

    La page correspondante s'ouvre.
  2. Cliquez dans le champ Header et sélectionnez YES si vous voulez insérer un logo dans le rapport à lancer.
    Le logo par défaut est un logo Talend, mais vous pouvez utiliser le logo de votre choix. Pour plus d'informations, consultez Personnaliser des logos dans les rapports.
  3. Cliquez sur l'icône de loupe du champ CONNECTION, pour afficher une boîte de dialogue listant les connexions à la base de données créées dans la perspective Profiling du Studio Talend.
  4. Dans la liste CONNECTION, sélectionnez la connexion à la base de données utilisée pour effectuer les analyses de colonnes dans la perspective Profiling du Studio Talend.
  5. Cliquez sur Confirm dans le coin inférieur droit de la boîte de dialogue.
    Le nom de la connexion sélectionnée s'affiche dans le champ CONNECTION.
  6. Cliquez sur Execute, en haut du panneau Parameters.
    Un indicateur de chargement s'affiche, puis un rapport sur toutes les analyses de colonnes, s'il y en a plusieurs, dans la connexion sélectionnée, s'ouvre dans la page.

    Exemple

    Dans cet exemple, trois rapports ont été générés sur trois analyses de colonnes dans la perspective Profiling du Studio Talend. Le rapport généré dans Talend DQ Portal pour la connexion sélectionnée fournit les informations suivantes concernant les colonnes analysées dans les trois analyses différentes :

    Libellé de la colonne

    Description

    Column

    noms des colonnes analysées.

    Distance

    résultats de la soustraction : taille de la colonne (COLUMN SIZE) moins la longueur maximale (MAX LENGTH). La distance fournit des informations concernant l'espace de stockage utilisé dans la colonne.

    Column size

    longueur des données définie pour la colonne dans la base de données.

    Min Length

    calcule la longueur minimale du texte dans la colonne.

    Average Length

    calcule la longueur moyenne du texte dans la colonne.

    Max Length

    calcule la longueur maximale du texte dans la colonne.

    Les résultats affichés dans le rapport permettent à l'Administrateur de réduire les besoins de stockage physique (COLUMN SIZE) pour certaines colonnes et d'économiser de l'espace dans celles-ci. Cet ajustement de l'espace de stockage des colonnes aura pour effet de réduire le stockage physique dans la table et dans la base de données.
  7. Dans le coin supérieur droit de la page, cliquez sur pour sauvegarder les paramètres du rapport.
    Vous pouvez exécuter un rapport sauvegardé sans définir à nouveau ses paramètres. Pour plus d'informations, consultez Accéder à la liste des rapports définis.