HIVE 分组排序查询 - 代码天地

HIVE 分组排序查询

其他 2020-02-16 22:27:16 阅读次数: 0

笔者在参加面试时遇到的一个关于hive数据库查询的的问题题意大概是这个样子的。有如下图结构的一个表：

表中的数据是长这个样子的：

面试官要求我查询的结果是长这个样子的

我第一印象觉得这个题还蛮简单的，就写了一个

select col1,col2,col3,max(col4) from test_select
group by col1,col2;

面试官说你确定吗？我就感觉这应该有问题，但是不知道具体哪里有问题，就硬着头皮说没有问题吧.....后来我就挂了【捂脸】

痛定思痛我回来后自己造了一些数据在hive下运行我写的SQL 确实是不行的原因是 select 后面只能跟分组的列和聚合的列

扫描二维码关注公众号，回复： 9203560 查看本文章

正确的写法应是：

select col1,col2,col3,col4 from (SELECT *, Row_Number() OVER (partition by col1,col2 ORDER BY col4 desc) rank FROM test1) as b 
 where b.rank == 1;

使用 row_number() over (partition by 分组列 order by 排序列）,这是我请教大佬后的一个写法，应该还有其他的写法，写在这里供大家参考吧

随便说一句上面的那个错误的写法在mysql中运行时一点问题没有的

这样说明了hiveSQL和mysql数据库还是有很多不同的大家需要留心

hbase和mysql的区别

1.hbase是一个nosql数据库，mysql是一个sql数据库

2.hbase是基于列存储的，mysql是行存储

3.hbase的数据类型只有一个string,mysql数据类型比较丰富

4.hbase的并发量支持非常高，mysql比较低

5.如果数据需要一些业务逻辑处理，那么使用mysql,

就是简单的数据，但是存储平率非常高，使用hbase

参考

https://one-line-it.blogspot.com/2012/11/hive-expression-not-in-group-by-key.html

https://www.yuque.com/hellobigdata/bigdata/ggtkbx

自由的行走

发布了42 篇原创文章 · 获赞 6 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/zkyxgs518/article/details/103472419

HIVE 分组排序查询

Hive_分组查询

hive 的分组排序用法

Hive学习04-查询分组 join 排序

Hive查询之排序

hive row_number分组排序top

Hive实现分组排序或者分页

hive的分组排序 row_number

Hive——Hive查询

Hive的查询

Hive查询

Hive 查询

hive排序

hive 排序

Hive的排序

Hive基础七---Hive查询

Hive（六）之 Hive查询

[Hive_9] Hive 的排序

Hive的排序以及分桶抽样查询

hive 分组topN

【hive】分组求排名

HIve分组查询返回每组的一条记录

hive中使用标准sql实现分组内排序

Hive常用的几个关于分组排序的窗口函数

Hive2 分组+排序+函数+自定义函数

hive 中实现分组排序（去重操作）

Hive之row_number() over分组排序

HIVE SQL几种不同的分组排序函数比较

hive：条件查询、join关联查询、分组聚合、子查询

hive查询导出到hdfs，hive，file

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)