Voir et exporter des données analysées - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Avant de commencer

  • Vous avez sélectionné la perspective Profiling.
  • Une analyse de colonnes doit avoir été créée et exécutée.

Pourquoi et quand exécuter cette tâche

Après exécution de votre analyse :
  • En utilisant le moteur SQL ou Java et dans la vue Analysis Results de l'éditeur d'analyse, vous pouvez cliquer-droit sur l'une des lignes de données dans la table des résultats statistiques et accéder à la vue des données courantes.
  • En utilisant le moteur Java, vous pouvez utiliser les résultats d'analyse pour accéder à une vue des données courantes.
  • En utilisant le moteur SQL, vous pouvez utiliser les résultats d'analyse pour ouvrir la perspective Data Explorer et accéder à la vue des données courantes.
Menu contextuel des données analysées dans la section Simple Statistics (Statistiques simples).

Procédure

  1. En bas de l'éditeur d'analyse, cliquez sur l'onglet Analysis Results afin d'ouvrir une vue détaillée des résultats d'analyse.
  2. Cliquez-droit sur une ligne de données dans les résultats statistiques d'une colonne analysée et choisissez une option :

    Option

    Operation (Opération)

    View rows

    Ouvrir une vue sur une liste de toutes les lignes de données dans la colonne analysée.

    Remarque : Pour l'indicateur Duplicate Count, l'option View rows liste toutes les lignes dupliquées. Si le nombre de doublons est 12 par exemple, cette option affiche 24 lignes.

    View values

    Ouvrir une vue sur une liste de toutes les valeurs courantes des données de la colonne analysée.

    Identify duplicates

    Générer un Job prêt à l'emploi identifiant et séparant les enregistrements uniques et les enregistrements en doublon dans la colonne sélectionnée, pour traitement. Ce Job écrit en sortie tous les doublons dans un fichier CSV de rejet par défaut et écrit les valeurs uniques dans un autre fichier séparé. Pour plus d'informations, consultez Générer un Job identifiant les valeurs en doublon d'une colonne analysée.

    D'autres options sont disponibles lorsque vous utilisez des expressions régulières et des modèles SQL dans une analyse de colonne(s).

    Si vous utilisez le moteur SQL, la vue s'ouvre dans la perspective Data Explorer et liste toutes les lignes ou les valeurs des données analysées selon les limites définies dans l'explorateur de données.

    Si la perspective Data Explorer n'est pas dans le Studio Talend, vous devez installer certaines bibliothèques SQL Explorer requises pour que la qualité de données fonctionne correctement. Si vous n'installez pas ces bibliothèques, un message d'erreur s'affiche.

    Pour plus d'informations concernant l'identification et l'installation des modules externes, consultez Installer des modules externes dans le Studio Talend.

    Exemple de requête et des lignes retournées par rapport à cette requête.
    Avertissement : L'explorateur de données ne supporte pas les connexions dont le nom d'utilisateur·trice est vide, par exemple la connexion en session unique (SSO, Single Sign-On) de MS SQL Server. Si vous analysez des données à l'aide d'une de ces connexions et que vous essayez de visualiser les lignes et les valeurs des données dans la perspective Data Explorer, un message d'avertissement apparaît et vous demande de configurer vos informations de connexion au serveur SQL.

    Lorsque vous utilisez le moteur Java, la vue s'ouvre dans votre Studio Talend et liste le nombre de lignes de données analysées que vous avez défini dans la vue Analysis parameters de l'éditeur d'analyse.

    Vue d'ensemble de l'onglet View rows (Voir les lignes).
  3. À partir de cette vue, vous pouvez exporter les données analysées vers un fichier CSV :
    1. Cliquez sur l'icône Export to .csv (Exporter en CSV) dans le coin supérieur gauche de la vue.
    2. Une boîte de dialogue s'affiche.
      Vue d'ensemble de la boîte de dialogue des options d'export vers CSV.
    3. Cliquez sur le bouton Choose (Choisir)... et parcourez votre répertoire jusqu'à l'emplacement où vous souhaitez stocker votre fichier CSV, puis donnez-lui un nom.
    4. Cliquez sur OK pour fermer cette boîte de dialogue.
      Un fichier CSV est créé à l'emplacement spécifié et il contient toutes les lignes de données analysées affichées dans la vue.