hive的分析函数--rank over,Row_Number() over,dense_rank()的区别

hive中三个排序函数rank、row_number、dense_rank日常中比较常用到,今天来说说三者的区别:

1、rank()函数

此排序方法进行排序时,相同的排序是一样的,而且下一个不同值是跳着排序的。

2、row_number()函数

此方法不管排名是否有相同的,都按照顺序1,2,3…..n 

3、dense_rank()函数

此方法对于排名相同的名次一样,且后面名次不跳跃

案例:

数据结构如下:

代码实例:


  
  
  1. --三种函数进行对比
  2. --rank:
  3. select id
  4. , name
  5. ,score
  6. , rank() over( order by score) as rank
  7. from dw_zdb.tmp_temp_inland_train
  8. --row_number
  9. select id
  10. , name
  11. ,score
  12. ,row_number() over( order by score) as dense_number
  13. from dw_zdb.tmp_temp_inland_train
  14. --dense_number
  15. select id
  16. , name
  17. ,score
  18. ,dense_number() over( order by score) as dense_number
  19. from dw_zdb.tmp_temp_inland_train

结果如下:

hive中三个排序函数rank、row_number、dense_rank日常中比较常用到,今天来说说三者的区别:

猜你喜欢

转载自blog.csdn.net/weixin_41919236/article/details/84563236