tDqReportRun - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Avertissement

Ce composant est disponible dans la Palette du Studio Talend si vous avez souscrit à l'un des produits Talend Platform.

Propriétés du tDqReportRun

Famille du composant

Data Quality

 

Fonction

Le composant tDqReportRun lance les analyses de profiling définies dans un rapport créé dans la perspective Profiling et génère un fichier de rapport sans que vous ayez à ouvrir le Studio Talend.

Ce composant exécute un report comme le fait l'élément Generate report file du menu, dans la perspective Profiling. Pour plus d'informations concernant la génération d'un fichier de rapport à partir d'éléments de rapport dans la vue DQ Repository, consultez le chapitre des Rapports, dans le Guide utilisateur du Studio Talend.

Objectif

Vous pouvez utiliser ce composant pour communiquer avec le Studio Talend, lancer les analyses listées dans un rapport et sauvegarder les résultats dans le datamart DQ.

Vous pouvez planifier le Job utilisant ce composant dans Talend Administration Center et le lancer simplement afin de générer le rapport sans avoir à déployer le Studio Talend sur le même serveur hôte que le serveur de Jobs.

Avec ce composant, vous pouvez générer tous les types de rapports (PDF, XML ou HTML) dans les dossier de votre choix et sauvegarder les résultats d'analyse dans le base de données de rapport.

Basic settings

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (Built-in), soit distant dans le Repository.

Le schéma de ce composant est en lecture seule. Il donne des informations concernant le rapport, notamment son ID, son nom ou encore son heure d'exécution.

 

 

Built-in : Le schéma sera créé et conservé pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans divers projets et Jobs. Voir également le Guide utilisateur du Studio Talend.

 

Refresh Dependency

Cliquez sur ce bouton pour mettre à jour les Jar requis par le datamart de rapports avant d'exécuter le Job de rapport. Cette opération est obligatoire lorsque vous changez le type de la base de données du datamart dans l'éditeur de rapport, dans la perspective Profiling.

Pour plus d'informations concernant la configuration des bases de données afin de stocker les résultats des rapports, consultez le chapitre des apports, dans le Guide utilisateur du Studio Talend.

 

Browse Reports

Cliquez sur ce bouton pour ouvrir une boîte de dialogue dans laquelle vous pouvez sélectionner un ou plusieurs rapport(s) à générer. Si les rapports sélectionnés stockent les résultats d'analyse dans des datamarts différents, la génération du rapport va stocker les résultats dans les différentes bases de données respectives. Cependant, un fichier de rapport est généré à l'emplacement défini dans l'onglet Basic settings du composant.

Tous les rapports créés dans la perspective Profiling sont listés dans cette boîte de dialogue.

 

Report filenames

Champs contenant le chemin technique du (des) rapport(s) à générer. Vous pouvez renseigner ces champs :

- automatiquement en sélectionnant le(s) rapport(s) dans la liste via le bouton Browse reports,

- manuellement, en saisissant ou collant le chemin technique du rapport. Vous pouvez copier le chemin technique du rapport depuis le panneau Detail view, sous DQ Repository, dans la perspective Profiling de votre Studio Talend, si vous sélectionnez ce rapport dans l'arborescence.

 

Browse Reports

Ce bouton ouvre une boîte de dialogue dans laquelle vous pouvez sélectionner un ou plusieurs rapport(s) à générer. Chaque rapport peut stocker les résultats dans un datamart différent. Cela peut créer une confusion si vous attendez des résultats stockés dans un seul emplacement.

Tous les rapports créés dans la perspective Profiling sont listés dans cette boîte de dialogue.

 

Output folder

Configurez le chemin d'accès au dossier où stocker le fichier de rapport généré.

Le chemin est paramétré par défaut vers le répertoire de votre Studio Talend. Il écrase les informations relatives au chemin d'accès configurées dans chaque élément de rapport.

Advanced settings

Driver JAR

Les fichiers .jar sont listés par défaut dans cette table si vous générez le Job via l'élément du menu Generate report file, dans la perspective Profiling.

Vous pouvez ajouter des fichiers Jar en ajoutant des lignes à la table. Cliquez sur le bouton [+] pour ajouter des lignes à la table. Dans chaque ligne, cliquez sur le bouton [...] pour ouvrir un assistant, dans lequel vous pouvez sélectionner un pilote JAR correspondant à la connexion utilisée par les analyses listées dans le rapport. Dans l'assistant, vous pouvez sélectionner des Jar provenant de modules internes ou externes.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau des composants.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est un composant de début au sein d'un Job. Il requiert un composant de sortie auquel envoyer des données relatives à l'exécution d'un rapport.

Note

Il est recommandé de générer un Job de lancement de rapport à l'aide de ce composant, dans la vue DQ Repository de la perspective Profiling de votre Studio Talend. Pour plus d'informations concernant la génération d'un Job prêt à l'emploi, consultez le chapitre des Rapports dans le Guide utilisateur du Studio Talend.

Scénario : Lancer un rapport de profiling depuis l'application Web Talend Administration Center

Ce scénario décrit comment exécuter à distance un Job lançant un rapport de qualité de données depuis l'application Web Talend Administration Center.

Pour ce faire, vous devez commiter toutes les métadonnées requises utilisées par Talend Administration Center, dans le référentiel distant SVN ou Git.

Prérequis

Procédez comme suit pour répondre aux prérequis du scénario :

  1. Créez un projet de qualité de données depuis votre application Web Talend Administration Center.

    Lancez le rapport depuis ce projet, dq_proj dans ce scénario.

    Pour plus d'informations concernant la création d'un projet dans Talend Administration Center, consultez le Guide utilisateur de Talend Administration Center.

    Si vous n'avez pas les droits nécessaires à la création ou à la gestion d'un projet, consultez l'administrateur de votre application Web.

  2. Etablissez une connexion de votre Studio Talend au référentiel SVN ou Git distant stockant le projet mentionné ci-dessus.

    Pour plus d'informations concernant la création de connexions, consultez le Guide utilisateur du Studio Talend.

  3. Lancez votre Studio Talend avec cette nouvelle connexion et ce nouveau projet.

    Pour plus d'informations concernant le lancement du Studio Talend, consultez le Guide utilisateur du Studio Talend.

Créer l'analyse et générer le rapport

  1. Dans la perspective Profiling du Studio Talend, créez une analyse.

  2. Cliquez-droit sur l'analyse et sélectionnez New Report pour ouvrir l'éditeur de rapport et générer un fichier de rapport sur cette analyse.

  3. Dans le champ Output_Folder, configurez le chemin d'accès à un répertoire local dans lequel sauvegarder le fichier de rapport. Dans le champ File Type, sélectionnez le format du rapport de sortie.

  4. Dans l'onglet Database Connection Settings, configurez les paramètres à la base de données de rapports dans laquelle sauvegarder les résultats d'analyse et cliquez sur Check pour valider votre connexion.

    Si la structure de la base de données à laquelle vous souhaitez vous connecter n'existe pas déjà dans la base de données, vous devez confirmer sa création.

    Pour plus d'informations concernant la génération d'un fichier de rapport et comment configurer une base de données de rapports, consultez le Guide utilisateur du Studio Talend.

    Les métadonnées requises, comme les paramètres d'analyse et de rapport, ainsi que la connexion à la base de données ont été commitées dans le référentiel SVN ou Git distant, utilisé par l'application Web Talend Administration Center.

Lancer le rapport à distance

  1. Dans la perspective Profiling, cliquez-droit sur le rapport Column Analysis_WithThresholds sous le nœud Report et sélectionnez Generate Jobs > Launch a report dans le menu contextuel.

    Cela génère un Job de lancement de rapport et l'ouvre dans la perspective Integration.

    Le champ Report filenames pointe vers le chemin technique du rapport et le champ Output Folder pointe vers le dossier où sauvegarder le fichier de rapport.

  2. Si nécessaire, appuyez sur F6 pour exécuter le Job dans le Studio Talend, à des fins de test.

  3. Connectez-vous à l'application Web Talend Administration Center.

  4. Dans la vue Menu, développez Conductor puis cliquez sur Job Conductor pour afficher la liste des tâches d'exécution.

    La page Job Conductor rassemble la génération de scripts, le déploiement de Jobs et les phases d'exécution de Jobs.

  5. Dans la barre d'outils de la page Job Conductor, cliquez sur Add > Normal Task pour vider le panneau de configuration Execution task.

    Dans ce panneau de configuration, configurez les paramètres requis pour l'exécution du Job lançant un rapport, comme suit :

    • Dans le champ Label, saisissez le nom de la tâche.

    • Dans le champ Project, sélectionnez le projet dans lequel le Job de lancement de rapport a été créé.

    • Dans le champ Branch, sélectionnez trunk comme branche du projet de ce projet.

    • Dans la liste Name, sélectionnez le Job de lancement de rapport à utiliser.

    • Dans la liste Version, sélectionnez la version du Job que vous souhaitez lancer. Dans le champ Context, sélectionnez le contexte avec lequel exécuter le Job.

    • Dans la liste Execution server, sélectionnez le serveur à utiliser pour exécuter la tâche que vous configurez.

  6. Cliquez sur Save pour valider la configuration de cette tâche d'exécution.

    La nouvelle tâche s'affiche dans la page Job Conductor sous le projet correspondant.

  7. Dans la liste des tâches, sélectionnez la nouvelle tâche.

  8. Dans la barre d'outils de la page Job Conductor, cliquez sur Generate.

  9. Une fois que le statut de la tâche est Ready to send dans la liste des tâches, sélectionnez la tâche et cliquez sur Deploy dans la barre d'outils.

  10. Une fois que le statut de la tâche est Ready to run dans la liste des tâches, sélectionnez la tâche et cliquez sur Run dans la barre d'outils.

    Lorsque vous exécutez le Job de lancement de rapport depuis l'application Web Talend Administration Center, l'analyse listée dans le rapport est exécutée et les résultats sont sauvegardés dans la base de données de rapport. Le fichier de rapport est sauvegardé dans le dossier de sortie défini dans les propriétés de base du composant tDqReportRun.