Avant de commencer
- Vous avez sélectionné la perspective Profiling depuis le Studio Talend.
- Vous avez ajouté le pilote JDBC au Studio.
Procédure
- Dans l'arborescence DQ Repository, développez Metadata et cliquez-droit sur DB Connections.
-
Cliquez sur Create DB Connection.
L'assistant Database Connection s'affiche.
- Saisissez un nom puis cliquez sur Next. Les autres champs sont requis.
- Sélectionnez JDBC dans DB Type.
-
Dans le champ JDBC URL, saisissez l'URL de votre cluster ADLS Databricks. Pour obtenir l'URL :
- Allez dans Azure Databricks.
- Dans la liste des clusters, cliquez sur le cluster auquel vous souhaitez vous connecter.
- Développez la section Advanced Options et sélectionnez l'onglet JDBC/ODBC.
-
Copiez le contenu du champ JDBC URL. Le format d'URL est
jdbc:spark://<server-hostname>:<port>/default;transportMode=http;ssl=1;httpPath=<http-path>;AuthMech=3
.Remarque : Pour chiffrer le jeton de manière sécurisée, il est recommandé de saisir les paramètresUID
etPWD
dans l'assistant Database Connection du Studio Talend.
- Retournez dans l'assistant Database Connection.
- Collez l'URL JDBC.
-
Ajoutez le pilote JDBC à la liste Drivers :
- Cliquez sur le bouton [+]. Une nouvelle ligne est ajoutée à la liste.
- Cliquez sur le bouton […] près de la nouvelle ligne. La boîte de dialogue Module s'ouvre.
- Dans la liste Platform, sélectionnez le pilote JDBC et cliquez sur OK. Vous retournez dans l'assistant Database Connection.
- Cliquez sur Select class name à côté du champ Driver Class et sélectionnez com.simba.spark.jdbc4.Driver.
- Saisissez l'identifiant User Id et le mot de passe Password.
-
Dans le fichier Mapping file, sélectionnez Mapping Hive.
La configuration est la suivante :
-
Cliquez sur Test Connection.
- Si le test est réussi, cliquez sur Finish pour fermer l'assistant.
- Si le test échoue, vérifiez la configuration.