20秒ごとに最も使用頻度の高い5つのハッシュタグを選択する - 7.3

Kafka

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > メッセージングコンポーネント > Kafka
データガバナンス > サードパーティーシステム > メッセージングコンポーネント > Kafka
データクオリティとプレパレーション > サードパーティーシステム > メッセージングコンポーネント > Kafka

手順

  1. tTopをダブルクリックして、[Component] (コンポーネント)ビューを開きます。
  2. [Number of line selected] (行数を指定)フィールドに、次のコンポーネントに出力する行数を入力します。tTopでソートされたデータの最初の行からカウントダウンします。この例では、 5です。つまり、20秒ごとに最も使用される 5つの ハッシュタグです。
  3. [Criteria] (条件)テーブルで、[+]ボタンをクリックして1行追加します。
  4. [Schema column] (スキーマカラム)カラムで、データをソートする対象のカラムであるcountを選択し、[sort num or alpha] (数字または英字でソート)カラムでnumを選択します。これは、ソートするデータが数字であることを意味します。さらに、[Order asc or desc] (昇順または降順で並べ替え)カラムでdescを選択して、データを降順に並べ替えます。