メイン コンテンツをスキップする 補完的コンテンツへスキップ

データベースからデータセットを追加

Talend Data Preparationはさまざまなデータベースに接続し、新しいデータセットを作成するためのソースとして使用できます。

Talend Data Preparationでは、デフォルトで以下のデータベースへの接続が提供されています:

  • AthenaDB
  • Azure SQL
  • Derby
  • MariaDB
  • MySQL
  • PostgreSQL
  • Redshift
  • Snowflake
  • SQL Server

これらの設定済み接続に使用されているドライバーのリストは、<TDP_installation_path>/dataprep/services/tcomp/config/jdbc_config.jsonファイルにあります。

この例では、MySQLデータベースに保存されている顧客データを準備するという想定で説明します。データベース接続情報をTalend Data Preparationインターフェイスで直接入力し、このデータから新しいデータセットを作成します。

手順

  1. ホームページの[Datasets] (データセット)Talend Data Preparationビューで、[Add Dataset] (データセットを追加)ボタンの横にある白い矢印をクリックします。
  2. [Database] (データベース)を選択します。

    [Add database dataset] (データベースデータセットの追加)フォームが開きます。

  3. [Dataset name] (データセット名)フィールドに、データセットに付ける名前を入力します。
  4. [Database type] (データベースタイプ)ドロップダウンリストで、接続するデータベースのタイプを選択します。この例では[MySQL]です。

    このリストには、必要に応じてデータベースタイプを追加できます。詳細は、「新しいデータベースタイプの追加」をご覧ください。

  5. MySQLデータベースにアクセスするためのURLを[JDBC URL]フィールドに入力します。

    フォームにはURLテンプレートが用意されています。値を自分の接続情報に合わせて変更します。

    • localhostを自分のIPアドレスに置き換えます。
    • 3306をMySQL用に設定したポートに置き換えます。3306はMySQLのデフォルトポートです。
    • dbを接続先となるデータベースの名前に置き換えます。
  6. [Username] (ユーザー名)フィールドと[Password] (パスワード)フィールドに、MySQL接続情報を入力します。
  7. [Test connection] (テスト接続)をクリックします。
    接続が成功するとフォームの2番目の部分が表示されますので、そこにデータベースのクエリーを入力できます。接続が失敗するとエラーメッセージが表示され、失敗の理由を詳しく示します。

    Talend Data Preparationからの接続をMySQLが許可していることを確認します。

  8. [Query] (クエリー)フィールドに、データベースに保存されているテーブルから情報を取得するためのクエリーを入力します。

    この場合、customersというテーブルからのすべての情報がデータセットとして取得され、出力されます。

  9. フォームの末尾にある[Add dataset] (データセットを追加)ボタンをクリックします。

タスクの結果

MySQLデータベース内のcustomersテーブルから抽出したデータがグリッド内に開かれ、プレパレーションの作業を通常どおりに開始できます。

データはMySQLデータベースに保存されたままの状態であり、Talend Data Preparationはサンプルのみをオンデマンドで取得します。

データセットはホームページの[Datasets] (データセット)ビューのリストに追加されます。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。