データベースからデータセットを追加 - 7.3

Talend Data Preparationユーザーガイド

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2023-11-29

Talend Data Preparationはさまざまなデータベースに接続し、新しいデータセットを作成するためのソースとして使用できます。

Talend Data Preparationでは、デフォルトで以下のデータベースへの接続が提供されています:

  • AthenaDB
  • Azure SQL
  • Derby
  • MariaDB
  • MySQL
  • PostgreSQL
  • Redshift
  • Snowflake
  • SQL Server

これらの設定済み接続に使用されているドライバーのリストは、<TDP_installation_path>/dataprep/services/tcomp/config/jdbc_config.jsonファイルにあります。

この例では、MySQLデータベースに保存されている顧客データを準備するという想定で説明します。データベース接続情報をTalend Data Preparationインターフェイスで直接入力し、このデータから新しいデータセットを作成します。

手順

  1. ホームページの[Datasets] (データセット)Talend Data Preparationビューで、[Add Dataset] (データセットを追加)ボタンの横にある白い矢印をクリックします。
  2. [Database] (データベース)を選択します。

    [Add database dataset] (データベースデータセットの追加)フォームが開きます。

  3. [Dataset name] (データセット名)フィールドに、データセットに付ける名前を入力します。
  4. [Database type] (データベースタイプ)ドロップダウンリストで、接続するデータベースのタイプを選択します。この例では[MySQL]です。

    このリストには、必要に応じてデータベースタイプを追加できます。詳細は、「新しいデータベースタイプの追加」をご覧ください。

  5. MySQLデータベースにアクセスするためのURLを[JDBC URL]フィールドに入力します。

    フォームにはURLテンプレートが用意されています。値を自分の接続情報に合わせて変更します。

    • localhostを自分のIPアドレスに置き換えます。
    • 3306をMySQL用に設定したポートに置き換えます。3306はMySQLのデフォルトポートです。
    • dbを接続先となるデータベースの名前に置き換えます。
  6. [Username] (ユーザー名)フィールドと[Password] (パスワード)フィールドに、MySQL接続情報を入力します。
  7. [Test connection] (テスト接続)をクリックします。
    接続が成功するとフォームの2番目の部分が表示されますので、そこにデータベースのクエリーを入力できます。接続が失敗するとエラーメッセージが表示され、失敗の理由を詳しく示します。

    Talend Data Preparationからの接続をMySQLが許可していることを確認します。

  8. [Query] (クエリー)フィールドに、データベースに保存されているテーブルから情報を取得するためのクエリーを入力します。

    この場合、customersというテーブルからのすべての情報がデータセットとして取得され、出力されます。

  9. フォームの末尾にある[Add dataset] (データセットを追加)ボタンをクリックします。

タスクの結果

MySQLデータベース内のcustomersテーブルから抽出したデータがグリッド内に開かれ、プレパレーションの作業を通常どおりに開始できます。

データはMySQLデータベースに保存されたままの状態であり、Talend Data Preparationはサンプルのみをオンデマンドで取得します。

データセットはホームページの[Datasets] (データセット)ビューのリストに追加されます。