hive 排序 - 代码天地

hive 排序

其他 2019-10-23 20:34:07 阅读次数: 0

1、全局排序（order by）

Order by：全局排序，只有一个reducer

ASC（ascend）：升序（默认）

DESC（descend）：降序

2、每个MR内部排序（sort by）

sort By：对于大规模的数据集order by的效率非常低。在很多情况下，并不需要全局排序，此时可以使用sort by

Sort By为每个Reducer产生一个排序文件。每个Reducer内部进行排序，对全局结果集来说不是排序。

（1）设置reduce个数

hive (default)> set mapreduce.job.reduces=3;

（2）根据部分编号降序查看员工信息

hive (default)> select * from emp sort by empno desc;

3、分区排序（Distribute By）

Distribute By：在某些情况下，我们需要控制某个特定行应该到哪个Reducer，通常是为了后续的聚集操作。

Distribute by类似MR中partition（自定义分区），进行分区，结合sort by使用

测试时要分配多个reduce进行处理，否则无法看到Distribute by的效果

 set mapreduce.job.reduces=3;

注意：

Distribute by的分区规则是根据分区字段的hashcode与reduce的个数进行取模后，余数相同的分到一个区
hive要求Distribute by语句要写在sort by语句之前

4、cluster by

当Distribute by 和sort by 字段相同时，可以使用cluster by 方式

cluster by除了具有distribute by的功能外还兼具sort by的功能。但是排序只能是升序排序，不能指定排序规则为ASC或者DESC。

1）以下两种写法等价

hive (default)> select * from emp cluster by deptno;

hive (default)> select * from emp distribute by deptno sort by deptno;

猜你喜欢

转载自www.cnblogs.com/hyunbar/p/11728550.html

hive排序

hive 排序

Hive的排序

[Hive_9] Hive 的排序

Hive并行排序

HIVE MAP排序 GenericUDF

HIVE中的排序细谈

Hive中的排序语法

hive之HQL 排序

hive 的分组排序用法

Hive查询之排序

HIVE SQL几种排序

Hive之排序

Hive-排序

HIVE 分组排序查询

Hive排序函数

Hive-桶排序

hive null值排序

hadoop生态--Hive（3）--Hive排序

Hive 的四种排序

1、hive实现全排序

hive的排序，分組练习

Hive中的几种排序方式

Hive(14):排序类型的sql

hive分桶，排序，连接

hive 三排序和优化

Hive_分区排序(Distribute By)

Hive_内部排序(Sort By)

Hive-全局排序、内部排序、分区、分区排序

Hive hql语句排序【全局排序、按别名排序、多个列排序、局部排序、分区排序】

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)