Profiler un fichier ADLS Databricks - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2023-09-22
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Depuis la perspective Profiling du Studio Talend, vous pouvez générer une analyse de colonnes sur un fichier ADLS Databricks via Hive.

Une connexion JDBC est requise pour vous connecter à Hive sur Databricks.

Procédure

Pour créer une analyse de profiling sur un fichier ADLS, vous devez :

  1. télécharger le pilote JDBC et l'ajouter au Studio,
  2. créer une connexion JDBC au cluster ADLS,
  3. créer une analyse de colonnes avec des indicateurs simples sur la table et les colonnes.
    Ces étapes sont décrites dans les procédures suivantes.

Que faire ensuite

Vous pouvez modifier les paramètres de l'analyse et ajouter d'autres indicateurs selon vos besoins. Vous pouvez également créer ultérieurement d'autres analyses sur ce fichier ADLS en utilisant la même table Hive.