Créer une analyse de catalogue - 6.1

Talend Data Services Platform Studio Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend Data Services Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Vous pouvez analyser un catalogue spécifique d'une base de données, si cette entité est utilisée dans la structure physique de la base de données. Le résultat de l'analyse donne des informations analytiques concernant le contenu de ce catalogue, par exemple son nombre de lignes, son nombre de tables, le nombre de lignes par table, etc.

Prérequis : Au moins une connexion à une base de données doit avoir été créée pour vous connecter à une base de données utilisant l'entité "catalogue".

Définir l'analyse

  1. Dans la vue DQ Repository, développez le nœud Data Profiling.

  2. Cliquez-droit sur le dossier Analyses et sélectionnez New Analysis.

    L'assistant [Create New Analysis] s'ouvre.

  3. Dans le champ de filtre, commencez à saisir catalog overview analysis, sélectionnez Catalog Overview Analysis et cliquez sur Next. Si votre studio est en français, saisissez analyse d'ensemble du catalogue.

  4. Dans le champ Name, saisissez un nom pour l'analyse.

    Note

    Il est recommandé de ne pas utiliser les caractères spéciaux suivants dans le nom de l'élément, notamment :

    "~", "!", "`", "#", "^", "&", "*", "\\", "/", "?", ":", ";", "\"", ".", "(", ")", "'", "¥", "'", """, "«", "»", "<", ">".

    Ces caractères seront remplacés par un "_" dans le système de fichiers. Vous risquez ainsi de créer des éléments en doublon.

  5. Définissez les métadonnées de l'analyse : Purpose, Description et Author (objectif, description et nom de l'auteur) dans les champs correspondants, puis cliquez sur Next.

Sélectionner le catalogue à analyser

  1. Développez le nœud DB Connections et la base de données incluant les entités "catalogue" dans sa structure physique, puis sélectionnez un catalogue à analyser.

  2. Cliquez sur Next.

  3. Définissez des filtres sur les tables et/ou sur les vues dans les champs correspondants, à l'aide du langage SQL.

    Par défaut, l'analyse inclura toutes les tables et les vues du catalogue.

  4. Cliquez sur Finish pour fermer l'assistant [Create New Analysis].

    Un dossier pour l'analyse nouvellement créée s'affiche sous le nœud Analysis dans la vue DQ Repository, et l'éditeur d'analyse s'ouvre avec les métadonnées définies de l'analyse.

    Note

    L'affichage de l'éditeur de connexion dépend des paramètres que vous avez configurés dans la boîte de dialogue [Preferences]. Pour plus d'informations, consultez Configurer les préférences des éditeurs et des résultats d'analyse.

  5. Cliquez sur Analysis Parameters.

    • Dans le champ Number of connections per analysis, configurez le nombre de connexions simultanées autorisé pour la connexion à la base de données sélectionnée.

      Vous pouvez configurer ce paramètre selon les ressources disponibles de la base de données, c'est-à-dire selon le nombre de connexions simultanées par analyse supporté par chaque base de données.

    • Vérifiez et/ou modifiez les filtres sur les tables ou les vues, s'il y en a.

  6. Dans la vue Context Group Settings, sélectionnez dans la liste l'environnement du contexte à utiliser pour exécuter l'analyse.

    La table dans cette vue liste tous les environnements de contexte et leurs valeurs définies dans la vue Contexts de l'éditeur d'analyses. Pour plus d'informations, consultez Utilisation des variables de contexte dans les analyses.

  7. Cliquez sur l'icône de sauvegarde en haut de l'éditeur, puis appuyez sur F6 pour exécuter l'analyse.

    Un message s'affiche pour confirmer que l'opération est en cours.

    Les résultats de l'analyse sont stockés dans la vue Statistical information.

  8. Cliquez sur Statistical information pour afficher les informations analytiques concernant le contenu du catalogue.

  9. Dans la vue Statistical information, vous pouvez :

    • Cliquer sur un catalogue dans la table analytique pour ouvrir une liste de résultats détaillant toutes les tables comprises dans le catalogue sélectionné et un résumé de leur contenu.

      Le catalogue sélectionné est surligné en bleu. Les catalogues surlignés en rouge indiquent des problèmes potentiels dans les données.

    • Cliquer-droit sur une table ou une vue et sélectionner Table analysis pour créer une analyse de table sur l'élément sélectionné.

    • Cliquer sur un en-tête dans la table analytique pour trier les données listées par ordre alphabétique.