Configurer la fréquence d'analyse des Tweets - 6.4

Kafka

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Messaging (Intégration) > Composants Kafka
Gouvernance de données > Systèmes tiers > Composants Messaging (Intégration) > Composants Kafka
Qualité et préparation de données > Systèmes tiers > Composants Messaging (Intégration) > Composants Kafka
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tWindow pour ouvrir sa vue Component.
    Ce composant est utilisé pour appliquer une fenêtre Spark sur un RDD d'entrée, afin que le Job analyse les Tweets des dernières 20 secondes après chaque intervalle de 15 secondes. Cela crée, entre l'application de deux fenêtres, un chevauchement d'un micro-batch, de 5 secondes, comme défini dans le champ Batch size dans l'onglet Spark configuration.
  2. Dans le champ Window duration, saisissez 20000 millisecondes, soit 20 secondes.
  3. Cochez la case Define the slide duration et, dans le champ qui s'affiche, saisissez 15000 millisecondes, soit 15 secondes.

Résultats

La configuration de la fenêtre est présentée au-dessus de l'icône du tWindow dans le Job que vous créez.