Créer une analyse de profiling sur un fichier ADLS Databricks via Hive - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Après avoir créé une connexion à un cluster ADLS Databricks via Hive, vous pouvez créer une analyse de profiling sur un fichier spécifique.

Avant de commencer

Procédure

  1. Dans la vue DQ Repository, développez Metadata > DB Connections > la connexion JDBC > Tables.
  2. Dans le dossier Columns, sélectionnez les colonnes à analyser et cliquez-droit sur celles-ci.
    Conseil : Pour créer une analyse sur toutes les colonnes, cliquez-droit sur le nom de la table.
  3. Passez votre curseur sur Column Analysis et sélectionnez le type d'analyse.
    L'assistant Create New Analysis s'ouvre.
  4. Saisissez un nom et cliquez sur Finish. Les autres champs sont facultatifs.
    Une nouvelle analyse sur le fichier ADLS sélectionné est automatiquement créée et s'ouvre dans l'éditeur d'analyse. Selon le type d'analyse sélectionné, les indicateurs sont automatiquement attribués aux colonnes.

    L'analyse s'applique à la table Hive, mais calcule les statistiques des données depuis ADLS en utilisant le mécanisme External tables. External tables conserve les données du fichier original en dehors de Hive. Si le fichier ADLS que vous avez choisi d'analyser est supprimé, l'analyse ne peut plus s'exécuter.

  5. Si nécessaire :
    • Modifiez les colonnes à analyser : Dans l'onglet Data Preview, cliquez sur Select Columns.
    • Ajoutez plus d'indicateurs ou de nouveaux modèles aux colonnes : Dans l'onglet Analyzed Columns, cliquez sur Select Indicators.
  6. Exécutez l'analyse pour afficher les résultats dans la vue Analysis Results de l'éditeur.

Que faire ensuite

Vous pouvez créer un rapport sur cette analyse. Consultez Créer un rapport sur des analyses spécifiques.