Informations supplémentaires concernant la durée, la période et les sessions des fenêtres - Cloud

Guide des processeurs de Talend Cloud Pipeline Designer

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
Création et développement > Création de Pipelines

Le processeur Window vous permet de partitionner des données de streaming en différents types de fenêtres temporelles : fenêtre temporelle fixe, fenêtre glissante et fenêtre de session.

Le processeur Window démarre une nouvelle fenêtre toutes les périodes period.

La fenêtre stocke en mémoire les enregistrements au cours d'une certaine durée (duration) et envoie les micro-batchs de données en sortie.

Fenêtres temporelles fixes

Les fenêtres fixes temporelles, aussi nommées fenêtres à bascule, sont la forme la plus simple de fenêtres :
  • toutes les fenêtres ont la même durée et ne se chevauchent pas

  • seule une fenêtre est stockée dans la mémoire à un moment précis

  • une seule donnée est capturée par fenêtre

Ces fenêtres sont utiles si vous souhaitez capturer toutes les données tout le temps.

Ici, toutes les données ayant un horodatage compris entre 00:00:00 et 01:00:00 appartiennent à la fenêtre 1, les données ayant un horodatage compris entre 01:00:00 et 02:00:00 appartiennent à la fenêtre 2, etc.

Fenêtres glissantes

Les fenêtres glissantes sont également appelées fenêtres temporelles glissantes :
  • plusieurs fenêtres peuvent se chevaucher

  • plusieurs fenêtres sont stockées en mémoire à un moment précis

  • les éléments d'un jeu de données peuvent être capturés dans plusieurs fenêtres

Ces fenêtres sont utiles à des fins d'échantillonnage et pour calculer plusieurs moyennes mobiles sur les données.

Toutes les données ayant un horodatage compris entre 00:00:00 et 01:00:00 appartiennent à la fenêtre 1, les données ayant un horodatage compris entre 00:30:00 et 01:30:00 appartiennent à la fenêtre 2, etc. Dans cet exemple, vous pouvez calculer une moyenne mobile des données de la dernière heure, en mettant le calcul à jour toutes les 30 minutes.

Toutes les données ayant un horodatage compris entre 00:00:00 et 01:00:00 appartiennent à la fenêtre 1, les données ayant un horodatage compris entre 01:30:00 et 02:30:00 appartiennent à la fenêtre 2, etc. Les fenêtres ne se chevauchent pas et les différentes données sont stockées dans différentes fenêtres.

Fenêtres de session

Les fenêtres de session sont des fenêtres qui contiennent les données stockées lors des écarts de données d'autres données :
  • de hautes concentrations de données sont regroupées dans des fenêtres séparées

  • des sections inactives du flux de données sont filtrées

  • les données peuvent être capturées dans des fenêtres disjointes de différentes tailles

Ces fenêtres sont utiles pour les données irrégulièrement distribuées dans le temps. Par exemple, un flux de données représentant l'activité de la souris d'un utilisateur ou d'une utilisatrice peut contenir de longues périodes d'inactivité et des grandes concentrations de clics.

Ici, les données représentant une certaine activité sont stockées dans une fenêtre qui se ferme lorsqu'elle ne reçoit aucune donnée pendant au moins cinq minutes (écart de durée). Les fenêtres ne se chevauchent pas et n'ont pas d'heure de début ou de fin fixe.