Créer une analyse de schéma - 6.1

Talend Real-time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend Real-Time Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Vous pouvez utiliser la perspective Profiling du studio pour analyser un schéma spécifique dans une base de données, si cette entité est utilisée dans la structure physique de la base de données. Le résultat de l'analyse fournit des informations analytiques concernant le contenu du schéma, par exemple son nombre de lignes, son nombre de tables, le nombre de lignes par table, etc.

Prérequis : Au moins une connexion à une base de données doit avoir été créée pour vous connecter à une base de données utilisant l'entité "schéma" pour structurer ses données, par exemple la base de données DB2. Pour plus d'informations, consultez Se connecter à une base de données.

Définir l'analyse

  1. Dans la vue DQ Repository, développez le nœud Data Profiling.

  2. Cliquez-droit sur le dossier Analyses et sélectionnez New Analysis.

    L'assistant [Create New Analysis] s'ouvre.

  3. Dans le champ de filtre, commencez à saisir schema, sélectionnez Schema Overview Analysis et cliquez sur le bouton Next. Si votre studio est en français, saisissez schéma.

  4. Dans le champ Name, saisissez un nom pour l'analyse.

    Note

    Il est recommandé de ne pas utiliser les caractères spéciaux suivants dans le nom de l'élément, notamment :

    "~", "!", "`", "#", "^", "&", "*", "\\", "/", "?", ":", ";", "\"", ".", "(", ")", "'", "¥", "'", """, "«", "»", "<", ">".

    Ces caractères seront remplacés par un "_" dans le système de fichiers. Vous risquez ainsi de créer des éléments en doublon.

  5. Définissez les métadonnées de l'analyse : Purpose, Description et Author (objectif, description et nom de l'auteur) dans les champs correspondants, puis cliquez sur Next.

Sélectionner le schéma à analyser

  1. Développez successivement les nœuds DB Connections et celui de la base de données contenant les entités "schémas" dans sa structure physique, puis sélectionnez un schéma à analyser.

  2. Cliquez sur Next.

  3. Définissez des filtres sur les tables et/ou les vues dans les champs correspondants, en utilisant le langage SQL.

    Par défaut, l'analyse inclura toutes les tables et les vues du catalogue.

  4. Cliquez sur Finish pour fermer l'assistant [Create New Analysis].

    Un dossier pour l'analyse nouvellement créée s'affiche sous le nœud Analysis dans la vue DQ Repository, et l'éditeur d'analyse s'ouvre avec les métadonnées définies de l'analyse.

    Note

    L'affichage de l'éditeur de connexion dépend des paramètres que vous avez configurés dans la boîte de dialogue [Preferences]. Pour plus d'informations, consultez Configurer les préférences des éditeurs et des résultats d'analyse.

  5. Cliquez sur Analysis Parameters.

    • Dans le champ Number of connections per analysis, configurez le nombre de connexions simultanées autorisé pour la connexion à la base de données sélectionnée.

      Vous pouvez configurer ce paramètre selon les ressources disponibles de la base de données, c'est-à-dire selon le nombre de connexions simultanées par analyse supporté par chaque base de données.

    • Vérifiez et/ou modifiez les filtres sur les tables ou les vues, s'il y en a.

  6. Dans la vue Context Group Settings, sélectionnez dans la liste l'environnement du contexte à utiliser pour exécuter l'analyse.

    La table dans cette vue liste tous les environnements de contexte et leurs valeurs définies dans la vue Contexts de l'éditeur d'analyses. Pour plus d'informations, consultez Utilisation des variables de contexte dans les analyses.

  7. Cliquez sur l'icône de sauvegarde en haut de l'éditeur, puis appuyez sur F6 pour exécuter l'analyse. Un message s'ouvre pour confirmer que l'opération est en cours.

    Les résultats d'analyse sont stockés dans la zone Statistical information.

  8. Cliquez sur Statistical information pour afficher les informations analytiques concernant le contenu du catalogue.

    Dans la vue Statistical information, vous pouvez :

    • Cliquer sur un schéma dans la table analytique pour ouvrir une liste de résultats détaillant toutes les tables comprises dans le catalogue sélectionné et un résumé de leur contenu.

      Le catalogue sélectionné est surligné en bleu. Les catalogues surlignés en rouge indiquent des problèmes potentiels dans les données.

    • Cliquer-droit sur une table ou une vue et sélectionner Table analysis pour créer une analyse de table sur l'élément sélectionné.

    • Cliquer sur un en-tête dans la table analytique pour trier les données listées par ordre alphabétique.