hive中使用标准sql实现分组内排序 - 代码天地

hive中使用标准sql实现分组内排序

数据库 2018-06-01 02:13:56 阅读次数: 0

在hive中，想要实现分组内排序，一般都是自己写udf实现oracle中分析函数row_number() over(partition)的功能，如果不使用自定义udf,仅使用标准sql实现的话，毫无性能可言，仅做实验而已。

方便起见，以下语句为oracle中语句，但都属于标准sql,在hive中亦可：

CREATE TABLE lxw_t (user_id VARCHAR2(20),
class VARCHAR2(20),
score NUMBER 
);

INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','语文','90');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','数学','86');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','英语','96');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','体育','77');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','语文','88');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','数学','65');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','英语','67');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','体育','98');


commit;

SELECT x.user_id,x.class,x.score,COUNT(1) AS seq 
FROM (
  SELECT a.*,b.score score2 FROM 
  liuxiaowen.lxw_t a ,
  liuxiaowen.lxw_t b 
  WHERE a.user_id = b.user_id (+) 
) x 
WHERE x.score2 >= x.score --按照成绩由高到低排列
--WHERE x.score >= x.score2  --按照成绩由低到高排列
GROUP BY x.user_id,x.class,x.score 
order BY 1,4

按照成绩由高到低排列的结果如下：

USER_ID	CLASS	SCORE	SEQ
user_1	英语	96	1
user_1	语文	90	2
user_1	数学	86	3
user_1	体育	77	4
user_2	体育	98	1
user_2	语文	88	2
user_2	英语	67	3
user_2	数学	65	4

按照成绩由低到高排列的结果如下：

USER_ID	CLASS	SCORE	SEQ
user_1	体育	77	1
user_1	数学	86	2
user_1	语文	90	3
user_1	英语	96	4
user_2	数学	65	1
user_2	英语	67	2
user_2	语文	88	3
user_2	体育	98	4

猜你喜欢

转载自superlxw1234.iteye.com/blog/1869612

hive中使用标准sql实现分组内排序

SQL实现group by 分组后组内排序

分组+组内排序的sql怎么写？

SQL实现分组排序和组内排序（相同分数并列排名）

Hive中使用 with as 优化SQL

mysql数据库使用sql实现分组排序

Hive实现分组排序或者分页

spark中使用groupByKey进行分组排序

【SQL进阶】分组后在分组内排序、每个分组中取前N条

HIVE SQL几种不同的分组排序函数比较

hive 的分组排序用法

HIVE 分组排序查询

sql 实现先分组再排序

Pandas---实现SQL中分组排序

sql中实现先排序后分组

Hive中使用sql的注意事项

hive中使用with as优化SQL语句

hive 中实现分组排序（去重操作）

HIVE SQL实现分组字符串拼接concat

MySQL中使用group_concat()函数进行分组排序

SQL数据排序与分组

SQL分组排序

SQL - 分组排序

hive（3）——在hive中使用自己写的函数（python实现）

mysql -- 先排序再分组的sql语句实现

mysql先分组再排序的sql语句实现

SQL 和 Java 代码，分别实现分组排序

hive中使用sql window函数 LAG/LEAD/FIRST/LAST

sql组内排序

HIVE SQL几种排序

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)