Talend Data Preparationは、各種データソースに接続し、新しいデータセットを作成できます。
この例では、Amazon S3に保存されている顧客データを準備するという想定で説明します。Amazon S3接続情報をTalend Data Preparationインターフェイスで直接入力し、このデータから新しいデータセットを作成します。
手順
-
ホームページの[Datasets] (データセット)Talend Data Preparationビューで、[Add Dataset] (データセットを追加)ボタンの横にある白い矢印をクリックします。
-
[Amazon S3]を選択します。
[Add Amazon S3 dataset] (Amazon S3データセットの追加)フォームが開きます。
-
[Dataset name](データセット名)フィールドに、データセットに付ける名前(たとえば、[Amazon S3 dataset](Amazon S3データセット))を入力します。
-
[Test connection] (テスト接続)をクリックします。
接続が成功するとフォームの2番目の部分が表示されますので、そこでインポートするオブジェクトを選択できます。接続が成功しなかった場合、エラーメッセージが表示され、接続失敗の理由の詳細が示されます。
-
[Bucket] (バケット)ドロップダウンリストから、Amazon S3のデータの場所を選択します。
-
[Path] (パス)フィールドに、バケットからインポートするデータセットへのパスを入力します。
-
フォーマット、レコードとフィールド区切り、テキストエンクロージャーとエスケープ文字、および対応するフィールドとドロップダウンリスト内にあるデータのエンコーディングを選択します。
-
フォームの末尾にある[Add dataset] (データセットを追加)ボタンをクリックします。
タスクの結果
インポートが完了すると、Amazon S3から抽出したデータが直接グリッドで開くので、プレパレーションの作業を通常どおりに開始できます。
データはAmazon S3に保存されたままであり、Talend Data Preparationはオンデマンドでのみサンプルを取得します。
データセットはホームページの[Datasets] (データセット)ビューのリストに追加されます。