Amazon S3からのデータセットの追加 - 8.0

Talend Data Preparationユーザーガイド

Version
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2024-03-26

Talend Data Preparationは、各種データソースに接続し、新しいデータセットを作成できます。

この例では、Amazon S3に保存されている顧客データを準備するという想定で説明します。Amazon S3接続情報をTalend Data Preparationインターフェイスで直接入力し、このデータから新しいデータセットを作成します。

手順

  1. ホームページの[Datasets] (データセット)Talend Data Preparationビューで、[Add Dataset] (データセットを追加)ボタンの横にある白い矢印をクリックします。
  2. [Amazon S3]を選択します。

    [Add Amazon S3 dataset] (Amazon S3データセットの追加)フォームが開きます。

  3. [Dataset name](データセット名)フィールドに、データセットに付ける名前(たとえば、[Amazon S3 dataset](Amazon S3データセット))を入力します。
  4. [Test connection] (テスト接続)をクリックします。
    接続が成功するとフォームの2番目の部分が表示されますので、そこでインポートするオブジェクトを選択できます。接続が成功しなかった場合、エラーメッセージが表示され、接続失敗の理由の詳細が示されます。
  5. [Bucket] (バケット)ドロップダウンリストから、Amazon S3のデータの場所を選択します。
  6. [Path] (パス)フィールドに、バケットからインポートするデータセットへのパスを入力します。
  7. フォーマット、レコードとフィールド区切り、テキストエンクロージャーとエスケープ文字、および対応するフィールドとドロップダウンリスト内にあるデータのエンコーディングを選択します。
  8. フォームの末尾にある[Add dataset] (データセットを追加)ボタンをクリックします。

タスクの結果

インポートが完了すると、Amazon S3から抽出したデータが直接グリッドで開くので、プレパレーションの作業を通常どおりに開始できます。

データはAmazon S3に保存されたままであり、Talend Data Preparationはオンデマンドでのみサンプルを取得します。

データセットはホームページの[Datasets] (データセット)ビューのリストに追加されます。