対象製品...Big Data Platform
Cloud API Services Platform
Cloud Big Data Platform
Cloud Data Fabric
Cloud Data Management Platform
Data Fabric
Data Management Platform
Data Services Platform
MDM Platform
Real-Time Big Data Platform
このタスクについて
DatabricksからS3システムにアクセスできるよう、S3固有のプロパティを追加の手順に従ってAmazon S3のDatabricksクラスターに接続します。
手順
-
[DQ Repository] (DQリポジトリー)ツリービューで、[Metadata] (メタデータ)を展開して[DB Connections] (DB接続)を右クリックします。
-
[Create DB connection] (データベース接続の作成)をクリックします。
データベース接続ウィザードが表示されます。
-
名前を入力して[Next] (次へ)をクリックします。他のフィールドはオプションです。
-
[DB Type] (DBタイプ)にJDBCを選択します。
-
[JDBC URL]フィールドに、ADLS DatabricksクラスターのURLを入力します。このURLは次のようにして取得します。
-
Azure Databricksに移動します。
-
クラスターリストで、接続先とするクラスターをクリックします。
-
[Advanced Options] (詳細オプション)セクションを展開し、[JDBC/ODBC]タブを選択します。
-
[JDBC URL]フィールドのコンテンツをコピーします。URLの形式は、
jdbc:spark://<server-hostname>:<port>/default;transportMode=http;ssl=1;httpPath=<http-path>;AuthMech=3
となります。
注: トークンをより安全に暗号化できるよう、Talend Studioの[Database Connection] (データベース接続)ウィザードにUID
パラメーターとPWD
パラメーターを入力することをお勧めします。
-
[Database Connection] (データベース接続)ウィザードを開きます。
-
JDBC URLを貼り付けます。
-
[Drivers] (ドライバー)リストにJDBCドライバーを追加します。
-
[+]ボタンをクリックします。リストに新しい行が追加されます。
-
この新しい行の横にある[…]ボタンをクリックします。[Module] (モジュール)ダイアログボックスが表示されます。
-
[Platform] (プラットフォーム)リストでJDBCドライバーを選択し、OKをクリックします。[Database Connection] (データベース接続)ウィザードに戻ります。
-
[Driver Class] (ドライバークラス)フィールドの横にある[Select class name] (クラス名の選択)をクリックし、com.simba.spark.jdbc4.Driverを選択します。
-
[User Id] (ユーザーID)と[Password] (パスワード)を入力します。
-
[Mapping file] (ファイルのマッピング)で[Mapping Hive] (Hiveのマッピング)を選択します。
-
[Test Connection] (テスト接続)をクリックします。
- テストが成功したら、[Finish] (終了)をクリックしてウィザードを閉じます。
- テストが失敗した場合は設定を検証します。