Voir les données analysées par rapport aux modèles - 7.0

Guide utilisateur de Talend Big Data Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
Création et développement
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Lorsque vous ajoutez un ou plusieurs modèle(s) à une colonne analysée, vous vérifiez toutes les données existantes dans la colonne par rapport au(x) modèle(s) spécifié(s). Après l'exécution de l'analyse de colonne, vous pouvez accéder à une liste de toutes les données valides/invalides dans la colonne analysée.

Si vous utilisez le moteur Java pour exécuter l'analyse, la vue des données s'ouvre dans la perspective Profiling de votre studio. Si vous utilisez le moteur SQL pour exécuter l'analyse, la vue des données s'ouvre dans la perspective Data Explorer.

Prérequis :
  • La perspective Profiling du studio doit être ouverte.

  • Les bibliothèques SQL Explorer requises pour la qualité de données doivent être installées dans le studio.

Si vous n'installez pas ces bibliothèques, la perspective Data Explorer sera absente du studio et de nombreuses fonctionnalités ne seront pas disponibles. Pour plus d'informations concernant l'identification et l'installation des modules externes, consultez le Talend Installation and Upgrade Guide.

Pour voir les données de la colonne analysée par rapport à un modèle spécifique, procédez comme suit :

Procédure

  1. Suivez les étapes décrites dans Définir les colonnes à analyser et Ajouter une expression régulière ou un modèle SQL dans une analyse de colonne(s) pour créer une analyse de colonne(s) utilisant un modèle.
  2. Exécutez l'analyse de colonne(s).
    L'éditeur passe à la vue Analysis Results.
  3. Parcourez l'indicateur Pattern Matching sous le nom de la colonne analysée.
    Le graphique généré pour la correspondance de modèles est accompagné d'un tableau détaillant l'affichage des résultats correspondants.
  4. Cliquez-droit sur la ligne du modèle dans le tableau Pattern Matching et sélectionnez :

    Option

    Pour...

    View valid/invalid values

    accéder, dans l'éditeur SQL, à une liste de toutes les valeurs valides/invalides, mesurées par rapport à un modèle utilisé pour la colonne sélectionnée.

    View valid/invalid rows

    accéder, dans l'éditeur SQL, à une liste de toutes les lignes valides/invalides mesurées par rapport à un modèle utilisé pour la colonne sélectionnée.

    Generate Jobs

    générer des Jobs qui récupèreront les lignes valides/invalides ou récupèreront les deux types de lignes dans la colonne sélectionnée et les écriront dans des fichiers de sortie ou dans des bases de données.

    Pour plus d'informations, consultez Récupérer les lignes correspondantes/non correspondantes.

Résultats

Si vous utilisez le moteur SQL, la vue s'ouvre dans la perspective Data Explorer et liste toutes les lignes ou les valeurs des données analysées selon les limites définies dans l'explorateur de données.

Cette vue de l'explorateur va également fournir des informations de base concernant l'analyse elle-même. De telles informations sont utiles lorsque vous travaillez avec de nombreuses analyses simultanément.

L'explorateur de données ne supporte pas les connexions dont le nom d'utilisateur est vide, par exemple la connexion en session unique (Single sign-on) de MS SQL Server. Si vous analysez des données à l'aide d'une de ces connexions et que vous essayez de visualiser les lignes et les valeurs des données dans la perspective Data Explorer, un message d'avertissement apparaît et vous demande de configurer vos informations de connexion au serveur SQL.

Si vous utilisez le moteur Java, la vue s'ouvre dans la Profiling perspective du studio et liste le nombre de données valides/invalides selon la limite définie dans la vue Analysis parameters de l'éditeur d'analyse. Pour plus d'informations, consultez Utiliser le moteur Java ou SQL.

Vous pouvez sauvegarder la requête exécutée et la lister sous les dossiers Libraries > Source Files dans la vue DQ Repository si vous cliquez sur l'icône de sauvegarde dans la barre d'outils de l'éditeur SQL. Pour plus d'informations, consultez Sauvegarder les requêtes exécutées sur les indicateurs.