データベースのデータセットで作成したプレパレーションのエクスポート - 2.5

Talend Data Preparation ユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
2.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation
データベースから抽出したデータセットのプレパレーションが完了したら、データをエクスポートできます。

手順

  1. アプリケーションヘッダーバーで[Export] (エクスポート)ボタンをクリックします。
  2. 完成したプレパレーションが現在のサンプルサイズ(デフォルトは10,000行)よりも大きい場合は、エクスポートオプションを選択する必要があります。
    • [Current sample] (現在のサンプル)を選択すると、作業していたサンプルのみがエクスポートされます。
    • [All data] (すべてのデータ)を選択すると、サンプルに対して実行したすべてのプレパレーションステップがデータセットの残りの部分にも適用されます。
  3. データのエクスポート先として、ローカルファイルまたはHadoopクラスターを選択してください。
    • データをローカルファイルcsvまたはxlsxとしてエクスポートすると、エクスポート操作はサーバー上で処理されます。Talend Data Preparation
    • データをHadoopクラスターにエクスポートすると、エクスポート操作はクラスター上で直接処理されます。出力ファイルのタイプをcsvavroparquetの中から選択します。ファイルの保存先として、クラスター上の任意のロケーションへのパスを入力します。また、Kerberosによる認証を行う場合は、プリンシパルとパスをkeytabファイルに入力します。
  4. [Confirm] (確認)をクリックします。

タスクの結果

ローカルファイルへのエクスポートの場合、[Current sample] (現在のサンプル)のみのエクスポートを選択すると、ダウンロードが自動的に開始します。[All data] (すべてのデータ)を選択すると、バックグラウンドでエクスポートプロセスが開始します。エクスポート履歴ページを使用して、エクスポートのステータスの確認や、出力ファイルのダウンロードを実行できます。詳細は、エクスポート履歴ページを参照してください。

エクスポートプロセスにより、データベースからフェッチされたデータによるリフレッシュがトリガーされ、出力内に表示されているデータを確実に常に最新の状態に保つことができます。

ただし、このリフレッシュ機能により、元々10,000行より小さいデータセットでもこの制限を超過できるようになりました。この場合は、次のようになります。

  • ローカルファイルにエクスポ0とする場合は、サンプルだけが維持される。
  • Hadoopクラスターにエクスポートする場合は、データ全体がエクスポートされる。