Sélectionner l'ensemble de colonnes à analyser - 7.0

Guide utilisateur de Talend Data Management Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Management Platform
task
Création et développement
EnrichPlatform
Studio Talend

Procédure

  1. Développez DB connections.
  2. Parcourez l'arborescence jusqu'à la base de données de votre choix, sélectionnez les colonnes que vous souhaitez analyser et cliquez sur Finish pour fermer l'assistant [New Analysis].
    Un dossier pour l'analyse nouvellement créée s'affiche sous le nœud Analyses dans la vue DQ Repository et l'éditeur d'analyse s'ouvre avec les métadonnées définies de l'analyse.
    Des données d'exemple sont affichées dans la zone Data Preview et les colonnes sélectionnées sont affichées dans la zone Analyzed Column de l'éditeur de l'analyse.
    Dans cet exemple, vous souhaitez analyser un ensemble de six colonnes dans la table customer : numéro de compte (account_num), scolarité (education), e-mail (email), prénom (fname), nom de famille (Iname) et sexe (gender). Les statistiques présentées dans les résultats d'analyse sont le nombre de lignes, de valeurs distinctes, de valeurs uniques et de valeurs en doublon s'appliquant sur tous les enregistrements (valeurs d'un ensemble de colonnes).
  3. Dans la zone Data preview, sélectionnez :

    Option

    Pour...

    New Connection

    ouvrir un assistant et créer ou modifier la connexion à la source de données depuis l'éditeur.

    Pour plus d'informations concernant la création d'une connexion à des sources de données, consultez Se connecter à une base de données et Se connecter à un fichier.

    Le champ Connection en haut de cette zone liste toutes les connexions créées dans le Studio.

    Select Columns

    ouvrir la boîte de dialogue Column Selection dans laquelle vous pouvez sélectionner les colonnes à analyser ou modifier la sélection des colonnes listées dans la table.

    Dans la boîte de dialogue ouverte, vous pouvez filtrer la liste des tables ou des colonnes à l'aide des champs Table filter et Column filter, respectivement.

    n first rows

    ou

    n random rows

    lister dans la table les N premiers enregistrements de données des colonnes sélectionnées ou lister N enregistrements aléatoires des colonnes sélectionnées.

    Rafraîchir les données

    afficher les données dans les colonnes sélectionnées selon les critères définis.

    Run with sample data

    exécuter l'analyse seulement sur le jeu de données d'exemple, dans le champ Limit.

  4. Dans le champ Limit, configurez le nombre d'enregistrements de données que vous souhaitez afficher dans la table et utiliser comme données d'exemple.