ツイートが分析される頻度を設定する - 7.3

Kafka

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > メッセージングコンポーネント > Kafka
データガバナンス > サードパーティーシステム > メッセージングコンポーネント > Kafka
データクオリティとプレパレーション > サードパーティーシステム > メッセージングコンポーネント > Kafka

手順

  1. tWindowをダブルクリックして[Component] (コンポーネント)ビューを開きます。
    このコンポーネントを使って、入力RDDにSparkウィンドウを適用し、このジョブが常に15秒ごとに最後の20秒間のツイートを分析するようにします。これにより、2つのウィンドウアプリケーションごとに、1つのマイクロバッチのオーバーラップが作成され、[Spark configuration] (Spark設定) タブの[Batch size] (バッチサイズ)フィールドで定義された5秒がカウントされます。
  2. [Window duration] (ウインドウ期間)フィールドに20000と入力します。これは20秒を意味します。
  3. [Define the slide duration] (スライドの継続時間を定義する)チェックボックスをオンにし、表示されるフィールドに15000と入力します。これは15秒を意味します。

タスクの結果

ウィンドウの設定は、設計しているジョブのtWindowのアイコンの上に表示されます。