データベースからのデータセットの追加 - 2.8

Talend Data Preparation ユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
2.8
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation

Talend Data Preparationはさまざまなデータベースに接続し、新しいデータセットを作成するためのソースとして使用することができます。

Talend Data Preparationでは、デフォルトで以下のデータベースへの接続が提供されています:

  • SQL Server
  • MySQL
  • Derby
  • Snowflake
  • PostgreSQL
  • Azure SQL
  • Redshift

これらの設定済み接続に使用するドライバーのリストは、<TDP_installation_path>/dataprep/services/tcomp/config/jdbc_config.jsonファイルにあります。

この例では、MySQLデータベースに保存されている顧客データを準備するという想定で説明します。データベース接続情報をTalend Data Preparationインターフェイスで直接入力し、このデータから新しいデータセットを作成します。

手順

  1. Talend Data Preparationホームページの[Datasets] (データセット)ビューで、[Add Dataset] (データセットを追加)ボタンのとなりの白い矢印をクリックします。
  2. [Database] (データベース)を選択します。

    [Add a database dataset] (データベースデータセットを追加)フォームが開きます。

  3. [Dataset name] (データセット名)フィールドに、データセットに付ける名前を入力します。
  4. [Database type] (データベースタイプ)ドロップダウンリストで、接続するデータベースのタイプを選択します。この例では[MySQL]です。

    このリストには、必要に応じてデータベースタイプを追加することができます。詳細は、新しいデータベースタイプの追加を参照してください。

  5. MySQLデータベースにアクセスするためのURLを[JDBC URL]フィールドに入力します。

    フォームにはURLテンプレートが用意されています。値を自分の接続情報に合わせて変更します。

    • localhostを自分のIPアドレスに置き換えます。
    • 3306をMySQL用に設定したポートに置き換えます。3306はMySQLのデフォルトポートです。
    • dbを接続先となるデータベースの名前に置き換えます。
  6. [Username] (ユーザー名)フィールドと[Password] (パスワード)フィールドに、MySQL接続情報を入力します。
  7. [Test connection] (接続のテスト)をクリックします。

    接続が成功するとフォームの2つ目の部分が表示されますので、そこにデータベースのクエリーを入力することができます。接続が確立されなかった場合は、その理由の詳細を示すエラーメッセージが表示されます。

    Talend Data Preparationからの接続をMySQLが許可していることを確認します。

  8. [Query] (クエリー)フィールドに、データベースに保存されているテーブルから情報を取得するためのクエリーを入力します。

    この場合、customersというテーブルからのすべての情報がデータセットとして取得され、出力されます。

  9. フォームの末尾にある[Add dataset] (データセットを追加)ボタンをクリックします。

タスクの結果

MySQLデータベース内のcustomersテーブルから抽出したデータがグリッド内に開かれ、プレパレーションの作業を通常どおりに開始できます。

データはMySQLデータベースに保存されたままの状態であり、Talend Data Preparationはサンプルのみをオンデマンドで取得します。

データセットはホームページの[Datasets] (データセット)ビュー内のリストに追加されます。