Sélectionner les colonnes de base de données et configurer les données d'exemple - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-02-13
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Procédure

  1. Développez le nœud DB connections et, dans la base de données souhaitée, parcourez les colonnes que vous voulez analyser.
    Remarque : Pour la base de données DB2, si des guillemets doubles existent dans le nom des colonnes d'une table, les guillemets doubles ne peuvent être récupérés avec les colonnes. Il est donc recommandé de ne pas utiliser de guillemet double dans le nom des colonnes dans les tables de la base de données DB2.
  2. Sélectionnez les colonnes et cliquez sur Finish pour fermer l'assistant.
    Un fichier pour la nouvelle analyse de colonnes s'affiche sous le nœud Analysis de la vue DQ Repository et l'éditeur d'analyse s'ouvre sur les métadonnées de cette analyse.
    Cet exemple analyse des noms complets, des adresses e-mail et des nombres relatifs à des ventes.
  3. Dans la vue Data preview, cliquez sur Refresh Data.
    Les données des colonnes sélectionnées sont affichées dans la table.
  4. Dans la vue Data preview, sélectionnez :
    Option Pour...
    New Connection ouvrir un assistant et créer une connexion à la source de données depuis l'éditeur.

    Le champ Connection en haut de cette section liste toutes les connexions créées dans le Studio Talend.

    Select Columns ouvrir la boîte de dialogue Column Selection dans laquelle vous pouvez sélectionner les colonnes à analyser ou modifier la sélection des colonnes listées dans la table. Dans la boîte de dialogue ouverte, vous pouvez filtrer la liste des tables ou des colonnes à l'aide des champs Table filter et Column filter, respectivement.
    Select Indicators ouvrir la boîte de dialogue Indicator Selection dans laquelle vous pouvez sélectionner les indicateurs à utiliser pour profiler les colonnes.
    n first rows ou n random rows lister dans la table les N premiers enregistrements de données des colonnes sélectionnées ou lister N enregistrements aléatoires des colonnes sélectionnées.
    Refresh Data afficher les données dans les colonnes sélectionnées selon les critères définis.
    Run with sample data exécuter l'analyse seulement sur le jeu de données d'exemple, dans le champ Limit.
  5. Dans le champ Limit, configurez le nombre d'enregistrements de données que vous souhaitez afficher dans la table et utiliser comme données d'exemple.
  6. Dans la vue Analyzed Columns, utilisez les flèches dans le coin supérieur droit pour ouvrir différentes pages dans la vue si vous souhaitez analyser un grand nombre de colonnes.
    Vous pouvez déposer les colonnes à analyser directement de la vue DQ Repository à la liste Analyzed Columns dans cette vue.
    Si l'une des colonnes que vous souhaitez analyser est une clé primaire ou étrangère, son type de data mining devient automatiquement Nominal lorsque vous la listez dans la vue Analyzed Columns.
    Pour plus d'informations, consultez Types de data mining.
  7. Si nécessaire, cliquez-droit sur l'une de colonnes listées dans la vue Analyzed Columns et sélectionnez Show in DQ Repository view, afin de l'afficher dans la connexion à la base de données, dans la vue DQ Repository.