メイン コンテンツをスキップする 補完的コンテンツへスキップ

HDFSデータセットで作成したプレパレーションのエクスポート

HDFSから抽出したデータセットのプレパレーションが終了したら、データセットを直接クラスターにエクポートし戻すことも、ローカルファイルとしてダウンロードすることもできます。

クレンジング済みのデータをエクスポートするクラスターは、元々データをインポートしたクラスターと同じである必要があります。

手順

  1. アプリケーションヘッダーバーで[Export] (エクスポート)ボタンをクリックします。
  2. 完成したプレパレーションが現在のサンプルサイズ(デフォルトは10,000行)よりも大きい場合は、エクスポートオプションを選択する必要があります。
    • [Current sample] (現在のサンプル)を選択すると、作業していたサンプルのみが区切り付きのローカルファイル、xlsxまたはtableauファイルとしてエクスポートされます。
    • [All data] (すべてのデータ)を選択すると、サンプルに対して実行したすべてのプレパレーションステップがデータセットの残りの部分にも適用され、HDFSエクスポートが有効になります。
  3. [HDFS]を選択します。
  4. [Format] (形式)フィールドで、データの出力形式を選択します。

    HDFSファイルの場合、Talend Data Preparationは区切り付きファイル、AVROおよびPARQUETをサポートします。

    区切り付きファイルを選択する場合は、出力ファイルに使用する区切りを選択します。

  5. [Output path] (出力パス)フィールドに、エクスポートされたファイルを保存するクラスター上の任意の場所への完全なURLを入力します。
  6. カスタムKeytabで認証する場合は、プリンシパルとkeytabファイルへのパスを入力します。

    パスは、クラスターの作業者全員がアクセスできるkeytabファイルを参照する必要があります。

  7. [Confirm] (確認)をクリックします。

    1つの行またはセルにしか影響しない処理がプレパレーションに含まれている場合、エクスポートプロセス中にこれらの処理はスキップされます。[Make as header] (ヘッダーとして作成)または[Delete Row] (行を削除)機能は、ビッグデータなどのコンテキストでは機能しません。プレパレーションにそのような処理が含まれている場合、エクスポートの前に警告が表示されます。

タスクの結果

サンプルをローカルファイルとしてエクスポートする場合は、出力ファイルのダウンロードが直接開始されます。

完全エクスポートの場合、ローカルファイルとしてエクスポートするかクラスターにエクスポートするかに関係なく、エクスポートプロセスがバックグラウンドで開始されます。エクスポート履歴ページを使用して、エクスポートのステータスの確認や、出力ファイルのダウンロードを実行できます。詳細は、エクスポート履歴ページ (英語のみ)を参照してください。

操作全体がHadoopクラスターで直接処理されます。

エクスポートプロセスにより、クラスターからフェッチしたデータの更新がトリガーされ、出力内に表示されているデータを確実に常に最新の状態に保つことができます。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。