Créer une connexion à un cluster Databricks ADLS - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Avant de commencer

Pourquoi et quand exécuter cette tâche

Pour vous connecter à un cluster Databricks sur Amazon S3, suivez cette procédure Ajouter des propriétés spécifiques S3 pour accéder au système S3 depuis Databricks.

Procédure

  1. Dans l'arborescence DQ Repository, développez Metadata et cliquez-droit sur DB Connections.
  2. Cliquez sur Create DB Connection.
    L'assistant Database Connection s'affiche.
  3. Saisissez un nom puis cliquez sur Next. Les autres champs sont requis.
  4. Sélectionnez JDBC dans DB Type.
  5. Dans le champ JDBC URL, saisissez l'URL de votre cluster ADLS Databricks. Pour obtenir l'URL :
    1. Allez dans Azure Databricks.
    2. Dans la liste des clusters, cliquez sur le cluster auquel vous souhaitez vous connecter.
    3. Développez la section Advanced Options et sélectionnez l'onglet JDBC/ODBC.
    4. Copiez le contenu du champ JDBC URL. Le format d'URL est jdbc:spark://<server-hostname>:<port>/default;transportMode=http;ssl=1;httpPath=<http-path>;AuthMech=3.
      Remarque : Pour chiffrer le jeton de manière sécurisée, il est recommandé de saisir les paramètres UID et PWD dans l'assistant Database Connection du Studio Talend.
  6. Retournez dans l'assistant Database Connection.
  7. Collez l'URL JDBC.
  8. Ajoutez le pilote JDBC à la liste Drivers :
    1. Cliquez sur le bouton [+]. Une nouvelle ligne est ajoutée à la liste.
    2. Cliquez sur le bouton […] près de la nouvelle ligne. La boîte de dialogue Module s'ouvre.
    3. Dans la liste Platform, sélectionnez le pilote JDBC et cliquez sur OK. Vous retournez dans l'assistant Database Connection.
  9. Cliquez sur Select class name à côté du champ Driver Class et sélectionnez com.simba.spark.jdbc4.Driver.
  10. Saisissez l'identifiant User Id et le mot de passe Password.
  11. Dans le fichier Mapping file, sélectionnez Mapping Hive.
  12. Cliquez sur Test Connection.
    • Si le test est réussi, cliquez sur Finish pour fermer l'assistant.
    • Si le test échoue, vérifiez la configuration.