Apache Spark Streamingジョブ用にSparkストリームを設定 - 8.0

Talend Data Fabric 入門ガイド

Version
8.0
Language
日本語 (日本)
EnrichDitaval
Data Fabric
Product
Talend Data Fabric
Module
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
Sparkジョブがどのくらいの頻度でマイクロバッチを作成し、処理するのかを定義します。

手順

  1. [Batch size] (バッチサイズ)フィールドで、ジョブがソースデータを検証して変更を特定し、新しいマイクロバッチを処理するまでの間隔を入力します。
  2. 必要な場合は、[Define a streaming timeout] (ストリーミングタイムアウトを設定)チェックボックスをオンにし、表示されたフィールドに、ストリーミングジョブが自動的に実行を停止するまでの期間を入力します。