60-330-000- 사용 - 창을 TopN 분석 및 구현

1. 미토

그림 삽입 설명 여기

2. 개요

을 TopN 디맨드 컴퓨팅 장면 모두 오프라인 또는 실시간 계산은 N 전에 광고 조회수의 계산을 광고 계산 인기 상품 매출의 전기 공급 업체로, 더 일반적으로, 검색의 수는 N 단어 검색을 계산하기 전에 검색 할 수 있습니다. 을 TopN 은유 뜨거운 판매 상품 매출은 각 상품의 총량으로 정렬 할 수 있습니다 말하기,을 TopN 그룹화, 글로벌을 TopN으로 구분하거나, 지역 그룹화 및 다양한 지리적 판매에서 사용할 수있는 다양한 제품의 전체 염기 서열 분석을 따를 수 있습니다. 제품의 뜨거운 판매에이 부분은, 예를 들어, 실시간 통계 상품 판매는 매 10 분 내에서 다양한 지리적 차원에서 TOP10.

이 수요는 다음 단계로 나눌 수 있습니다 :

  • 데이터 타임 이벤트 시간을 추출하기 위해
  • 판매 각 10 분에 대한 지역 + 상품 치수, 통계으로
  • 차원에 대한이 지역에 의하면,이 지역의 통계 제품 TOP10 판매

3. 추출 시간

(ID는 생략 사용자 포함)의 주문 번호, 주문시, 제품 ID, 지역 ID, 주문 금액 : 카프카 데이터 소스 유형으로서 데이터 선에 대한 데이터 인

case class Order(orderId: String, orderTime: Long, gdsId: String, amount: Double, areaId: String)

우리는 여기에 통계 자료마다 10 분에, 30의 최대 지연을 허용 할 수 있습니다 주문 문제에서 계정에 데이터의 존재를 고려하여, 주문을 실시간으로 통계를 따라 이벤트 시간 EVENTTIME를 사용하려면

val

추천

출처blog.csdn.net/qq_21383435/article/details/105280253