Créer une analyse de contenu d'une base de données - 6.5

Talend Open Studio for Data Quality Guide utilisateur

EnrichVersion
6.5
EnrichProdName
Talend Open Studio for Data Quality
task
Qualité et préparation de données
EnrichPlatform
Studio Talend

Dans la perspective Profiling, vous pouvez créer une analyse pour examiner le contenu d'une base de données spécifiée.

Prérequis : Au moins une connexion à une base de données doit être définie dans la perspective Profiling du studio. Pour plus d'informations, consultez Créer des connexions aux différentes sources de données.

Pour créer une analyse de contenu d'une base de données, vous devez d'abord définir l'analyse correspondante puis sélectionner la connexion à la base de données que vous souhaitez analyser.

Définir l'analyse

  1. Dans la vue DQ Repository, développez le nœud Data Profiling.

  2. Cliquez-droit sur le dossier Analyses et sélectionnez New Analysis.

    L'assistant [Create New Analysis] s'ouvre.

  3. Dans le champ de filtre, commencez à saisir connection overview analysis, sélectionnez Connection Analysis dans la liste qui s'affiche et cliquez sur Next. Si votre studio est en français, saisissez analyse d'ensemble des connexions.

    Vous pouvez créer une analyse de contenu de base de données via une procédure utilisant des raccourcis, si vous cliquez-droit sur la base de données sous Metadata > DB connections et sélectionnez Overview analysis dans le menu contextuel.

  4. Dans le champ Name, saisissez un nom pour l'analyse.

    Note

    Il est recommandé de ne pas utiliser les caractères spéciaux suivants dans le nom de l'élément, notamment :

    "~", "!", "`", "#", "^", "&", "*", "\\", "/", "?", ":", ";", "\"", ".", "(", ")", "'", "¥", "'", """, "«", "»", "<", ">".

    Ces caractères seront remplacés par un "_" dans le système de fichiers. Vous risquez ainsi de créer des éléments en doublon.

  5. Définissez les métadonnées de l'analyse : Purpose, Description et Author (objectif, description et nom de l'auteur) dans les champs correspondants, puis cliquez sur Next.

Sélectionner la connexion à la base de données que vous souhaitez analyser

  1. Développez le nœud DB Connections et sélectionnez une connexion à analyser, s'il y en a plus d'une.

  2. Cliquez sur Next.

  3. Définissez des filtres sur les tables et/ou les vues que vous souhaitez analyser dans les champs correspondants, en utilisant le langage SQL.

    Par défaut, l'analyse examine toutes les tables et les vues de la base de données.

  4. Cliquez sur Finish pour fermer l'assistant [Create New Analysis].

    Un dossier pour l'analyse nouvellement créée s'affiche sous le dossier Analyses dans la vue DQ Repository, et l'éditeur de connexion s'ouvre avec les métadonnées définies.

    Note

    L'affichage de l'éditeur de connexion dépend des paramètres que vous avez configurés dans la boîte de dialogue [Preferences]. Pour plus d'informations, consultez Configurer les préférences des éditeurs et des résultats d'analyse.

  5. Cliquez sur Analysis Parameters.

    • Dans le champ Number of connections per analysis, configurez le nombre de connexions simultanées autorisé pour la connexion à la base de données sélectionnée.

      Vous pouvez configurer ce paramètre selon les ressources disponibles de la base de données, c'est-à-dire selon le nombre de connexions simultanées par analyse supporté par base de données.

    • Vérifiez et/ou modifiez les filtres sur les tables ou les vues, s'il y en a.

    • Cochez la case Reload databases si vous souhaitez recharger toutes les bases de données de votre connexion lors de l'exécution des analyses d'ensemble

      Lorsque vous tentez de recharger une base de données, un message vous demande confirmation, car toute modification de la structure de la base de données peut affecter les analyses existantes.

  6. Dans la vue Context Group Settings, sélectionnez dans la liste l'environnement du contexte d'environnement

    La table dans cette vue liste tous les environnements de contexte et la valeur que vous leur avez définie dans la vue Contexts, dans l'éditeur d'analyse. Pour plus d'informations, consultez Utilisation des variables de contexte dans les analyses.

  7. Appuyez sur F6 pour exécuter l'analyse.

    Un message s'ouvre au bas de l'éditeur pour confirmer que l'opération est en cours et que les résultats d'analyse sont ouverts dans la vue Analysis Results.

  8. Cliquez sur Statistical informations afin d'afficher des informations analytiques concernant le contenu de la base de données.

  9. Dans la vue Statistical information, vous pouvez :

    • Cliquer sur un catalogue ou un schéma pour en lister toutes les tables, ainsi qu'un résumé de leur contenu : nombre de lignes, clés et index personnalisés.

      Le catalogue ou schéma sélectionné est surligné en bleu. Les catalogues ou les schémas surlignés en rouge indiquent des problèmes potentiels dans les données.

    • Cliquer-droit sur un catalogue ou un schéma et sélectionner Overview analysis pour analyser le contenu de l'élément sélectionné.

    • Cliquer-droit sur une table ou une vue et sélectionner Table analysis pour créer une analyse de table sur l'élément sélectionné. Vous pouvez voir les clés et index d'une table sélectionnée. Pour plus d'informations consultez Affichage des clés et des index des tables de base de données.

    • Cliquer sur un en-tête de colonne dans la table analytique pour trier alphabétiquement les données listées dans les catalogues ou les schémas.

Vous pouvez trier alphabétiquement les données listées dans les catalogues ou les schémas, en cliquant simplement sur l'en-tête d'une colonne du tableau analytique. Vous pouvez également trier alphabétiquement toutes les colonnes dans le tableau des résultats, en procédant de la même façon.