フライトKPIの結果をファイルシステムに書き込む - 7.2

Delta Lake

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > テクニカルコンポーネント > Delta Lake components
データガバナンス > サードパーティーシステム > テクニカルコンポーネント > Delta Lake components
データクオリティとプレパレーション > サードパーティーシステム > テクニカルコンポーネント > Delta Lake components

手順

  1. tFileOutputDelimited (名前はkpi_output)をダブルクリックして[Component] (コンポーネント)ビューを開きます。
  2. [Define a storage configuration component] (ストレージ設定コンポーネントを定義)チェックボックスをオンにして、tHDFSConfigurationで定義された接続情報を再利用します。
  3. tMAPで定義されたデータスキーマがtFileOutputDelimitedによって正しく取得されるように、[Sync columns] (カラムの同期)をクリックしてください。
  4. [Folder] (フォルダー)フィールドで、計算されたKPI結果を保存するディレクトリーをtS3Configurationで定義されたS3バケットに入力します。
  5. [Action] (アクション)ドロップダウンリストで、使用するフォルダーがまだ存在しない場合は[Create] (作成)を、このフォルダーが既に存在する場合は[Overwrite] (上書き)を選択します。
  6. [Include Header] (ヘッダーを含める)を選択して、計算結果とともにカラム名を出力します。
  7. [Merge result to single file] (結果を1つのファイルにマージする)を選択して、partファイルを1つの単一ファイルに マージし、表示される[Merge File Path] (ファイルパスのマージ)フィールドに、マージされたデータが書き込まれるディレクトリーとファイル名を同じS3バケットに入力します。
  8. ターゲットファイルがすでに存在する場合は、[Override target file] (ターゲットファイルを上書き)を選択します。
  9. [Run] (実行)タブで[Run] (実行)をクリックしてジョブを実行します。

タスクの結果

実行が正しく完了したら、このマージファイルをS3からダウンロードして、米国のフライトのKPI情報を参照します。