データセットをデータベースから追加する - 2.5

Talend Data Preparationユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
2.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation

Talend Data Preparationはさまざまなデータベースに接続し、新しいデータセットを作成するためのソースとして使用することができます。

Talend Data Preparationでは、デフォルトで以下のデータベースへの接続が提供されています:

  • SQL Server
  • MySQL
  • Derby
  • Snowflake
  • PostgreSQL
  • Azure SQL
  • Redshift

これらの設定済み接続に使用されているドライバーのリストは、<TDP_installation_path>/dataprep/services/tcomp/config/jdbc_config.jsonファイルにあります。

この例では、MySQLデータベースに保存されている顧客データを準備するという想定で説明します。データベース接続情報をTalend Data Preparationインターフェイスで直接入力し、このデータから新しいデータセットを作成します。

手順

  1. ホームページの[Datasets] (データセット)Talend Data Preparationビューで、[Add Dataset] (データセットを追加)ボタンのとなりの白い矢印をクリックします。
  2. [Database] (データベース)を選択します。

    [Add a database dataset] (データベースデータセットを追加)フォームが開きます。

  3. [Dataset name] (データセット名)フィールドに、データセットに付ける名前を入力します。
  4. [Database type] (データベースタイプ)ドロップダウンリストで、接続するデータベースのタイプを選択します。この例では[MySQL]です。

    このリストには、必要に応じてデータベースタイプを追加することができます。詳細は、新しいデータベースタイプの追加を参照して下さい。

  5. MySQLデータベースにアクセスするためのURLを[JDBC URL]フィールドに入力します。

    フォームにはURLテンプレートが用意されています。値を自分の接続情報に合わせて変更します。

    • localhostを自分のIPアドレスに置き換えます。
    • 3306をMySQL用に設定したポートに置き換えます。3306はMySQLのデフォルトポートです。
    • dbを接続先となるデータベースの名前に置き換えます。
  6. [Username] (ユーザー名)フィールドと[Password] (パスワード)フィールドに、MySQL接続情報を入力します。
  7. [Test connection] (接続のテスト)をクリックします。

    接続が成功するとフォームの2つ目の部分が表示されますので、そこにデータベースのクエリを入力することができます。接続が失敗するとエラーメッセージが表示され、失敗の理由を詳しく示します。

    Talend Data Preparationからの接続をMySQLが許可していることを確認します。

  8. [Query] (クエリー)フィールドに、データベースに保存されているテーブルから情報を取得するためのクエリーを入力します。

    この場合、customersというテーブルからの全ての情報がデータセットとして取得され、出力されます。

  9. フォームの末尾にある[Add dataset] (データセットを追加)ボタンをクリックします。

タスクの結果

MySQLデータベース内のcustomersテーブルから抽出したデータがグリッド内に開かれ、プレパレーションの作業を通常どおりに開始できます。

データはMySQLデータベースに保存されたままの状態であり、Talend Data Preparationはサンプルのみをオンデマンドで取得します。

データセットはホームページの[Datasets] (データセット)ビューのリストに追加されます。