set hive.groupby.skewindata与数据倾斜

编程语言 2018-05-13 06:07:04 阅读次数: 0

hive和其它关系数据库一样，支持count(distinct)操作，但是对于大数据量中，如果出现数据倾斜时，会使得性能非常差，解决办法为设置数据负载均衡，其设置方法为设置hive.groupby.skewindata参数

hive (default)> set hive.groupby.skewindata;

hive.groupby.skewindata=false

默认该参数的值为false，表示不启用，要启用时，可以set hive.groupby.skewindata=ture;进行启用。

当启用时，能够解决数据倾斜的问题，但如果要在查询语句中对多个字段进行去重统计时会报错。

hive> set hive.groupby.skewindata=true;

hive> select count(distinct id),count(distinct x) from test;

FAILED: SemanticException [Error 10022]: DISTINCT on different columns not supported with skew in data

下面这种方式是可以正常查询

hive>select count(distinct id, x) from test;

猜你喜欢

转载自daizj.iteye.com/blog/2283332

set hive.groupby.skewindata与数据倾斜

hive.groupby.skewindata为

set.hive.groupby.skewindata=true专讲

hive.groupby.skewindata与负载均衡

hive.groupby.skewindata=true作用

hive.groupby.skewindata=true注意点

Hive - hive.groupby.skewindata环境变量与负载均衡

hive.map.aggr、hive.groupby.skewindata执行过程

hive.groupby.skewindata环境变量与负载均衡 ---》待总结

数据集划分——train set, validate set and test set

Set和Map数据

Set数据结构

Set 数据结构

set数据类型

数据结构 Set

hive collect_set函数

set

set()

Hibernate HQL 查询Set数据

set、map数据结构

Redis数据类型--Set

Luogu 3620 数据备份 - Set

List、Set、数据结构

python 数据结构 set

Redis---数据之set

Redis数据类型Set

MySQL SET数据类型

常用的数据脚本 set 语句

Redis set 数据类型

268 Set 数据结构（★★）

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)