Procédure
-
Dans la perspective Integration du Studio, créez un Job Spark Streaming depuis le nœud Job Designs dans la vue Repository.
Pour plus d'informations concernant la création d'un Job Spark Streaming, consultez Guide de prise en main de Talend Open Studio for Big Data.
- Dans l'espace de modélisation graphique, saisissez le nom du composant à utiliser et sélectionnez ce composant dans la liste qui s'affiche. Dans ce scénario, les composants utilisés sont un tHDFSConfiguration, un tKafkaInput, un tWindow, un tExtractJSONFields, un tMap, un tAggregateRow, un tTop et un tLogRow.
- Reliez le tKafkaInput, le tWindow, le tExtractJSONFields et le tMap à l'aide d'un lien Row > Main.
- Reliez le tMap au tAggregateRow à l'aide d'un lien Row > Main et nommez cette connexion dans la boîte de dialogue qui s'ouvre. Par exemple, nommez-la hashtag.
- Reliez le tAggregateRow, le tTop et le tLogRow à l'aide d'un lien Row > Main.
- Laissez le composant tHDFSConfiguration seul, sans connexion.