ツイートが分析される頻度を設定 - Cloud - 8.0

Kafka

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > メッセージングコンポーネント > Kafka
データガバナンス > サードパーティーシステム > メッセージングコンポーネント > Kafka
データクオリティとプレパレーション > サードパーティーシステム > メッセージングコンポーネント > Kafka

手順

  1. tWindowをダブルクリックして[Component] (コンポーネント)ビューを開きます。
    このコンポーネントを使って、入力RDDにSparkウィンドウを適用し、このジョブが常に15秒ごとに最後の20秒間のツイートを分析するようにします。これにより、2つのウィンドウアプリケーションごとに、1つのマイクロバッチのオーバーラップが作成され、[Spark configuration] (Spark設定) タブの[Batch size] (バッチサイズ)フィールドで定義された5秒がカウントされます。
  2. [Window duration] (ウインドウ期間)フィールドに20000と入力します。これは20秒を意味します。
  3. [Define the slide duration] (スライドの継続時間を定義する)チェックボックスをオンにし、表示されるフィールドに15000と入力します。これは15秒を意味します。

タスクの結果

ウィンドウの設定は、設計しているジョブのtWindowのアイコンの上に表示されます。