Amazon S3データセットで作成したプレパレーションのエクスポート - 2.8

Talend Data Preparation ユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
2.8
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation
Amazon S3から抽出したデータセットのプレパレーションが完了したら、データをエクスポートできます。

手順

  1. アプリケーションヘッダーバーで[Export] (エクスポート)ボタンをクリックします。
  2. [All data] (すべてのデータ)チェックボックスを選択します。

    この例では、プレパレーションの結果は、デフォルトで10000行の現在のサンプルサイズを超えています。

  3. [Amazon S3]を選択します。

    Amazon S3のエクスポートは、プレパレーションの結果がデフォルトで10000行を超える場合に使用できます。

  4. 対応するフィールドにAmazon S3アクセスキーとシークレットキーを入力します。
  5. ドロップダウンリストから[Region] (地域)を選択肢、データの保存先にするバケットの名前を手動で入力します。
  6. [Object] (オブジェクト)フィールドに、データをバケットに保存するオブジェクトへのパスを入力します。
  7. [Encrypt data at rest] (保存データの暗号化)チェックボックスを選択してデータの暗号化を有効にする場合は、KMSマスターキーを入力します。
  8. カスタムKeytabで認証する場合は、プリンシパルとkeytabファイルへのパスを入力します。
  9. [Confirm] (確認)をクリックします。

タスクの結果

ビッグデータのコンテキストでTalend Data Preparationを使用する場合、エクスポートはHadoopクラスターで処理されます。それ以外の場合はTalend Data Preparationサーバーで処理されます。

ビッグデータのコンテキストでは、1つの行だけに適用されるプレパレーションステップはエクスポート中スキップされます。

エクスポートプロセスはバックグラウンドで開始されます。[Export history] (エクスポート履歴)ページを使用して、エクスポートのステータスの確認や、出力ファイルのダウンロードを実行できます。詳細は、エクスポート履歴ページを参照して下さい。