Accéder au contenu principal Passer au contenu complémentaire

Profiler un fichier ADLS Databricks

Depuis la perspective Profiling du Studio Talend, vous pouvez générer une analyse de colonnes sur un fichier ADLS Databricks via Hive.

Une connexion JDBC est requise pour vous connecter à Hive sur Databricks.

Procédure

Pour créer une analyse de profiling sur un fichier ADLS, vous devez :

  1. télécharger le pilote JDBC et l'ajouter au Studio Talend,
  2. créer une connexion JDBC au cluster ADLS,
  3. créer une analyse de colonnes avec des indicateurs simples sur la table et les colonnes.
    Ces étapes sont décrites dans les procédures suivantes.

Que faire ensuite

Vous pouvez modifier les paramètres de l'analyse et ajouter d'autres indicateurs selon vos besoins. Vous pouvez également créer ultérieurement d'autres analyses sur ce fichier ADLS en utilisant la même table Hive.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !