Générer des fichiers de rapport - 6.4

Talend Real-time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.4
EnrichProdName
Talend Real-Time Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Vous pouvez générer un fichier de rapport, soit dans l'arborescence DQ Repository, soit dans l'éditeur de rapport ouvert.

Générer un fichier de rapport depuis le studio à l'aide d'une des deux méthodes garantit la mise à jour dans le référentiel du résumé de l'analyse. Cependant, les cases Refresh et Refresh All dans l'éditeur de rapport doivent être cochées. Pour plus d'informations, consultez Créer un nouveau rapport.

Avertissement

Si vous essayez de générer un fichier de rapport alors que la version de la base de données de rapports ne correspond pas à celle du Studio, un message d'avertissement vous prévient que vous devez migrer la base de données de rapports. Pour plus d'informations, consultez Migrer la base de données distante.

Prérequis :

- Un fichier de rapport doit avoir été créé dans la perspective Profiling du studio. Pour plus d'informations, consultez Créer un nouveau rapport.

La case Generate output file de la vue Generated Report Settings est cochée.

Pour générer un rapport existant, procédez comme suit :

  1. Dans la vue DQ Repository, double-cliquez sur le rapport que vous souhaitez générer.

    L'éditeur de rapport s'ouvre sur le rapport sélectionné.

  2. Dans la barre d'outils de l'éditeur de rapport, cliquez sur le bouton .

    Chaque analyse listée dans l'éditeur de rapport du rapport sélectionné et marquée comme devant être rafraîchie est exécutée, puis les données sont historisées dans la base de données de rapports. Un rapport est généré (en pdf, html, xsl ou xml).

    Le rapport généré est listé sous le dossier Generated Document dans la vue DQ Repository.

    Ce rapport sera commité sur le serveur SVN ou Git hébergeant le référentiel partagé, puis sera partagé à tous les membres de l'équipe, si :

    Sinon, le rapport sera stocké dans le dossier défini mais ne sera pas commité sur le serveur SVN ou Git.

  3. Double-cliquez sur le document généré pour ouvrir le rapport.

    Ci-dessous se trouve un exemple d'un rapport généré en PDF, affichant les résultats des analyses listées dans le rapport sélectionné.

    Ce rapport présente les résultats d'une analyse de table dans laquelle les enregistrements d'âge sont évalués par rapport à une règle métier SQL définie. Pour plus d'informations, consultez Créer une analyse de table avec des règles métier SQL.

    Ce rapport fournit des statistiques de basse fréquence des modèles dans la colonne email. Pour plus d'informations, consultez Définir les colonnes à analyser et configurer les indicateurs.

    Dans la table, les modèles utilisent a et A pour représenter les valeurs des e-mails. Chaque modèle peut avoir jusqu'à 30 caractères. Si le nombre total de caractères dépasse 30, le modèle est représenté comme suit : aaaaaAAAAAaaaaaAAAAAaaaaaAAAAA...<nombre total de caractères>.

    Ce rapport fournit des statistiques simples concernant le nombre d'enregistrements dans une colonne spécifique. Pour plus d'informations, consultez Définir les colonnes à analyser et configurer les indicateurs.

    Dans la table des résultats de l'analyse de colonnes, lorsque la valeur d'un indicateur est affichée en rouge, cela signifie que le seuil défini sur cet indicateur dans l'éditeur d'analyse de colonnes a été dépassé. Pour plus d'informations concernant les seuils de données, consultez Définir les options pour les indicateurs système ou personnalisés.

    Les valeurs du tableau de résultats affichées dans la colonne Indicator OK peuvent être expliquées ainsi :

    Valeur

    Description

    N

    Un seuil a été défini sur l'indicateur dans l'analyse de colonnes et l'indicateur ne respecte pas ce seuil.

    Y

    Un seuil a été défini sur l'indicateur dans l'analyse de colonnes et l'indicateur respecte ce seuil.

    N/A

    Aucun seuil n'a été défini sur l'indicateur.

    Ce rapport présente les résultats de la comparaison de deux colonnes identiques dans deux tables différentes. Pour plus d'informations, consultez Comparaison de colonnes identiques dans différentes tables.

    Ce rapport détecte jusqu'à quel point une valeur déterminante dans une colonne détermine de manière fonctionnelle d'autres valeurs dans une colonne dépendante. Les résultats retournés, dans la colonne %Match indiquent l'importance de la dépendance fonctionnelle pour chaque colonne déterminante. Les enregistrements ne correspondant pas sont indiqués en rouge. Pour plus d'informations, consultez Détecter des anomalies dans des colonnes (Analyse de dépendance fonctionnelle).

    Ce rapport présente un cas possible de données frauduleuses via l'analyse d'une colonne numérique par rapport à l'indicateur Benford Law. Pour plus d'informations, consultez Détection de la fraude.

Pour générer un rapport sans ouvrir l'éditeur de rapport, procédez comme suit :

  • Dans la vue DQ Repository, cliquez-droit sur un rapport et sélectionnez Run report dans le menu contextuel.

    Vous pouvez générer simultanément différents fichiers pour plusieurs rapports, si vous sélectionnez les rapports, cliquez-droit sur la sélection et sélectionnez Run report. Cependant, lorsque vous utilisez une base de données HSQL pour stocker les résultats des rapports, vous pouvez exécuter un rapport à la fois seulement.

    Un message s'affiche dans la barre de statut pour confirmer que l'opération est bien en cours. Un fichier pour le rapport sélectionné est généré et stocké dans le dossier Generated Document dans la vue Repository.

    Chaque analyse listée dans l'éditeur de rapport du rapport sélectionné et marqué à rafraîchir est exécuté, les données sont historisées dans la base de données de rapports. Un rapport est généré (au format pdf, html, xsl ou xml).

    Ce rapport sera commité sur le serveur SVN ou Git hébergeant le référentiel partagé, puis sera partagé à tous les membres de l'équipe, si :

    Sinon, le rapport sera stocké dans le dossier défini mais ne sera pas commité sur le serveur SVN ou Git.