60-330-000-使用 - ウィンドウのTopN分析と実装

1.水戸

ここに画像を挿入説明

2.概要

TopN需要がオフラインまたはリアルタイムの計算はNの前に広告のヒットの計算を宣伝し、計算の人気商品販売で、このような電気のサプライヤーとして、より一般的であり、検索数がNワード検索を計算する前に検索し、両方のシーンを計算します。topNは、上位Nをグループ化し、グローバルのtopNに分け、比喩的に言えば、売れ筋商品の販売は、各商品の合計金額でソートできます。または、地域のグループ化と様々な地理的な販売で利用可能な様々な製品の総直接配列決定に従うことができます。商品の熱い販売のこの部分は、例えば、リアルタイム統計の商品販売は、すべて10分以内に様々な地理的次元の下TOP10。

この需要は、以下のステップに分けることができます。

  • データタイムイベント時間を抽出するために
  • 販売の各10分間地域+商品の寸法により、統計
  • 次元の地域によると、地域の統計財のTOP10販売

3.抽出時間

(Idは省略するユーザを含む)注文ID、注文時、製品ID、領域ID、注文量:カフカは、データソースの種類、を含むデータのラインのデータであります

case class Order(orderId: String, orderTime: Long, gdsId: String, amount: Double, areaId: String)

ここでは、統計データのすべての10分で、30代の最大の遅延を可能にすることができるための問題のうちの口座にデータの存在を取って、注文にリアルタイムの統計情報を追跡イベントタイムイベント時刻を使用したいです

val

おすすめ

転載: blog.csdn.net/qq_21383435/article/details/105280253