Talend Data Preparationはさまざまなデータベースに接続し、新しいデータセットを作成するためのソースとして使用できます。
Talend Data Preparationでは、デフォルトで以下のデータベースへの接続が提供されています:
- AthenaDB
- Azure SQL
- Derby
- MariaDB
- MySQL
- PostgreSQL
- Redshift
- Snowflake
- SQL Server
これらの設定済み接続に使用されているドライバーのリストは、<TDP_installation_path>/dataprep/services/tcomp/config/jdbc_config.jsonファイルにあります。
この例では、MySQLデータベースに保存されている顧客データを準備するという想定で説明します。データベース接続情報をTalend Data Preparationインターフェイスで直接入力し、このデータから新しいデータセットを作成します。
手順
-
ホームページの[Datasets] (データセット)Talend Data Preparationビューで、[Add Dataset] (データセットを追加)ボタンの横にある白い矢印をクリックします。
-
[Database] (データベース)を選択します。
[Add database dataset] (データベースデータセットの追加)フォームが開きます。
-
[Dataset name] (データセット名)フィールドに、データセットに付ける名前を入力します。
-
[Database type] (データベースタイプ)ドロップダウンリストで、接続するデータベースのタイプを選択します。この例では[MySQL]です。
このリストには、必要に応じてデータベースタイプを追加できます。詳細は、「新しいデータベースタイプの追加」をご覧ください。
-
MySQLデータベースにアクセスするためのURLを[JDBC URL]フィールドに入力します。
フォームにはURLテンプレートが用意されています。値を自分の接続情報に合わせて変更します。
localhost
を自分のIPアドレスに置き換えます。
3306
をMySQL用に設定したポートに置き換えます。3306
はMySQLのデフォルトポートです。
db
を接続先となるデータベースの名前に置き換えます。
-
[Username] (ユーザー名)フィールドと[Password] (パスワード)フィールドに、MySQL接続情報を入力します。
-
[Test connection] (テスト接続)をクリックします。
接続が成功するとフォームの2番目の部分が表示されますので、そこにデータベースのクエリーを入力できます。接続が失敗するとエラーメッセージが表示され、失敗の理由を詳しく示します。
Talend Data Preparationからの接続をMySQLが許可していることを確認します。
-
[Query] (クエリー)フィールドに、データベースに保存されているテーブルから情報を取得するためのクエリーを入力します。
この場合、customers
というテーブルからのすべての情報がデータセットとして取得され、出力されます。
-
フォームの末尾にある[Add dataset] (データセットを追加)ボタンをクリックします。
タスクの結果
MySQLデータベース内の
customers
テーブルから抽出したデータがグリッド内に開かれ、プレパレーションの作業を通常どおりに開始できます。
データはMySQLデータベースに保存されたままの状態であり、Talend Data Preparationはサンプルのみをオンデマンドで取得します。
データセットはホームページの[Datasets] (データセット)ビューのリストに追加されます。