始める前に
必須追加ライブラリー
AthenaJDBC42-2.0.7.jarの準備ができているはずです。まだダウンロードしていない場合は、
こちらからAthena JDBCドライバーをダウンロードします。
このタスクについて
以下のステップに従って、
Talend StudioジョブをAmazon Athenaに接続するためのJDBC接続をセットアップします。
手順
-
Talend Studioの[Repository] (リポジトリー)ツリービューで[Metadata] (メタデータ)ノードを展開し、[DB Connections] (DB接続)を右クリックして、[Create Connection] (接続を作成)を選択します。
[Database Connection] (データベース接続)ウィザードが開きます。
-
接続名と目的を指定し、[Next] (次へ)をクリックします。
-
[DB Type] (DBタイプ)リストから[JDBC]を選択します。
-
[JDBC URL]フィールドには、AWSユーザーIDとパスワードを含むJDBC URLの詳細が表示されます。
jdbc:awsathena://AwsRegion=<AWS Region>;User=<AWS Access Key>;Password=<AWS Secret Key>;S3OutputLocation=<S3 folder>
-
必要な追加ライブラリーをインストールします。
-
[Drivers] (ドライバー)テーブルで、[+]ボタンをクリックして線を追加し、[...]ボタンをクリックして[Module] (モジュール)ダイアログボックスを開きます。
-
[Install a new module] (新しいモジュールをインストール)オプションを選択し、[...]ボタンをクリックしてダウンロードされたjarファイルを参照します。
-
[Detect the module install status] (モジュールのインストール状況を検出)ボタンをクリックし、[OK]をクリックしてダイアログボックスを閉じます。
-
[Database connection] (データベース接続)ウィザードに戻り、[Select class name] (クラス名を選択)ボタンをクリックし、Amazon Athenaと通信できるようにするドライバーのメインクラスを選択します。
-
[User Id] (ユーザーID)および[Password] (パスワード)フィールドにデータベースユーザー認証データを入力します。
-
[Test connection] (接続テスト)をクリックし、[Finish] (終了)をクリックしてウィザードを閉じます。
-
[Repository] (リポジトリー)ツリービューで、作成した JDBC 接続を右クリックし、接続されているAmazon Athenaサービスのテーブルスキーマを取得するため[Retrieve schema] (スキーマを取得)を選択します。