Créer une analyse de catalogue ou de schéma

Talend Open Studio for Data Quality Guide utilisateur

EnrichVersion
6.2
EnrichProdName
Talend Open Studio for Data Quality
task
Qualité et préparation de données
EnrichPlatform
Studio Talend

Vous pouvez utiliser la perspective Profiling du studio pour analyser un schéma ou catalogue spécifique dans une base de données, si cette entité est utilisée dans la structure physique de la base de données. Le résultat de l'analyse fournit des informations analytiques concernant le contenu du schéma, par exemple son nombre de lignes, son nombre de tables, le nombre de lignes par table, etc.

Prérequis : Au moins une connexion à une base de données doit avoir été créée pour vous connecter à une base de données utilisant l'entité "catalogue" ou "schéma". Pour plus d'informations, consultez Créer des connexions aux différentes sources de données.

  1. Sous DB connections, dans la vue DQ Repository, cliquez-droit sur le catalogue ou schéma pour lequel vous souhaitez créer l'analyse de contenu, puis sélectionnez Overview analysis dans le menu contextuel.

    Cet exemple vous montre comment créer une analyse de schéma.

  2. Dans l'assistant qui s'ouvre, saisissez un noom pour l'analyse.

    Note

    Il est recommandé de ne pas utiliser les caractères spéciaux suivants dans le nom de l'élément, notamment :

    "~", "!", "`", "#", "^", "&", "*", "\\", "/", "?", ":", ";", "\"", ".", "(", ")", "'", "¥", "'", """, "«", "»", "<", ">".

    Ces caractères seront remplacés par un "_" dans le système de fichiers. Vous risquez ainsi de créer des éléments en doublon.

  3. Si nécessaire, configurez les métadonnées de l'analyse (objectif, description et auteur) dans les champs correspondants, puis cliquez sur Next.

  4. Configurez les filtres sur les tables et/ou vues que vous souhaitez analyser dans les champs correspondants, selon vos besoins, à l'aide du langage SQL.

    Par défaut, l'analyse examine toutes les tables et vues dans le catalogue.

  5. Cliquez sur Finish.

    Un dossier pour l'analyse nouvellement créée s'affiche sous le nœud Analysis dans la vue DQ Repository, et l'éditeur d'analyse s'ouvre avec les métadonnées définies de l'analyse.

  6. Appuyez sur F6 pour exécuter l'analyse.

    Un message s'ouvre au bas de l'éditeur pour confirmer que l'opération est en cours. Les résultats de l'analyse sout ouverts dans la vue Analysis Results.

Dans la vue Statistical information, vous pouvez :

  • Cliquer sur un schéma pour lister toutes les tables ainsi qu'un résumé de leur contenu : nombre de lignes, clés et index personnalisés.

    Le schéma sélectionné est surligné en bleu. Les schémas surlignés en rouge indiquent des problèmes potentiels dans les données.

  • Cliquer-droit sur un schéma et sélectionner Overview analysis pour analyser le contenu de l'élément sélectionné.

  • Cliquer-droit sur une table ou une vue et sélectionner Table analysis pour créer une analyse de table sur l'élément sélectionné. Vous pouvez également voir les clés et index d'une table sélectionnée. Pour plus d'informations, consultez Affichage des clés et des index des tables de base de données.

  • Cliquer sur un en-tête dans la table analytique pour trier les données listées par ordre alphabétique.