Stormトポロジーを使って人々のアクティビティを分析する(非推奨)

Stormトポロジーを使って人々のアクティビティを分析する(非推奨) - 7.3

Kafka

Version

7.3

Language

日本語

Product

Talend Big Data

Talend Big Data Platform

Talend Data Fabric

Talend Real-Time Big Data Platform

Module

Talend Studio

Content

ジョブデザインと開発 > サードパーティーシステム > メッセージングコンポーネント > Kafka

データガバナンス > サードパーティーシステム > メッセージングコンポーネント > Kafka

データクオリティとプレパレーション > サードパーティーシステム > メッセージングコンポーネント > Kafka

Last publication date

2024-02-22

非推奨

StormのフレームワークはTalend 7.1以降、非推奨となっています。ストリーミング関連のタスクを実行するには、Apache Spark Streaming用のTalendジョブを使用してください。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

このシナリオは、Talend Real Time Big Data PlatformおよびTalend Data Fabricにのみ適用されます。

このシナリオでは、所定の人々のアクティビティに関するメッセージを、設計するトポロジーに送信する目的で、コンポーネント4つのStormジョブ(トポロジー)を作成します。これは、それらのアクティビティの人気を分析するためです。

このジョブは、Kafkaトピックプロデューサーが作成した関連項目をサブスクライブします。つまり、メッセージのフィードを維持するには、メッセージングシステムにKafkaクラスターをインストールする必要があります。Kafkaメッセージングサービスの詳細は、Kafkaに関するApacheのドキュメンテーションを参照してください。

他方、このジョブはStorm上で実行されるため、Stormシステムをすぐに使える状態にしておく必要があります。Stormの詳細は、Stormに関するApacheのドキュメンテーションを参照してください。

Hortonwork Data Platform 2.1 (HDP2.1)にインストールされているStormシステムを使用する場合、Storm DRPC (分散リモートプロシージャーコール)サーバーの名前がAmbariのWebコンソールでStormの[Config] (設定)タブのCustom storm.yamlセクションで適切に定義されていることを確認します。たとえば、Server1およびServer2という2つのStorm DRPCサーバーを使用し、Custom storm.yamlセクションで次のように定義する必要があります: [Server1,Server2]。

このシナリオを複製するには、次の手順に従います。