Apache Sparkストリーミングジョブ用にSparkストリームを設定する - 7.0

Talend Data Fabric入門ガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Fabric
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
Sparkジョブがどのくらいの頻度でマイクロバッチを作成し、処理するのかを定義します。

手順

  1. [Batch size] (バッチサイズ)フィールドで、ジョブがソースデータを検証して変更を特定し、新しいマイクロバッチを処理するまでの間隔を入力します。
  2. 必要な場合は、[Define a streaming timeout] (ストリーミングタイムアウトを設定)チェックボックスを選択し、表示されたフィールドに、ストリーミングジョブが自動的に実行を停止するまでの期間を入力します。