Créer une analyse de profiling sur un fichier ADLS Databricks via Hive - 8.0

Guide d'utilisation de Talend Big Data Platform Studio

Version
8.0
Language
Français (France)
EnrichDitaval
Big Data Platform
Product
Talend Big Data Platform
Module
Studio Talend
Content
Création et développement

Après avoir créé une connexion à un cluster ADLS Databricks via Hive, vous pouvez créer une analyse de profiling sur un fichier spécifique.

Avant de commencer

  • Vous avez sélectionné la perspective Profiling depuis le Studio Talend.
  • Vous avez créé une connexion JDBC au fichier ADLS Databricks.

    Pour plus d'informations concernant les analyses de colonnes, consultez Par quoi commencer ?.

Procédure

  1. Dans la vue DQ Repository, développez Metadata > DB Connections > la connexion JDBC > Tables.
  2. Dans le dossier Columns, sélectionnez les colonnes à analyser et cliquez-droit sur celles-ci.
    Conseil : Pour créer une analyse sur toutes les colonnes, cliquez-droit sur le nom de la table.
  3. Passez votre curseur sur Column Analysis et sélectionnez le type d'analyse.
    L'assistant Create New Analysis s'ouvre.
  4. Saisissez un nom et cliquez sur Finish. Les autres champs sont facultatifs.
    Une nouvelle analyse sur le fichier ADLS sélectionné est automatiquement créée et s'ouvre dans l'éditeur d'analyse. Selon le type d'analyse sélectionné, les indicateurs sont automatiquement attribués aux colonnes.

    L'analyse s'applique à la table Hive, mais calcule les statistiques des données depuis ADLS en utilisant le mécanisme External tables. External tables conserve les données du fichier original en dehors de Hive. Si le fichier ADLS que vous avez choisi d'analyser est supprimé, l'analyse ne peut plus s'exécuter.

  5. Si nécessaire :
    • Dans l'onglet Data Preview, cliquez sur Select Columns afin de modifier les colonnes à analyser.
    • Dans l'onglet Analyzed Columns, cliquez sur Select Indicators pour ajouter des indicateurs ou des modèles aux colonnes.
  6. Exécutez l'analyse pour afficher les résultats dans la vue Analysis Results de l'éditeur.

Que faire ensuite

Vous pouvez créer un rapport sur cette analyse. Consultez Créer un rapport sur des analyses spécifiques.