Hive - 问题 & 解决 - 代码天地

Hive - 问题 & 解决

其他 2020-03-06 10:28:31 阅读次数: 0

1 Hive - mapjoin

问题：

hive sql:select f.a,f.b from A t join B f on ( f.a=t.a and f.ftime=20110802)
该语句中B表有30亿行记录，A表只有100行记录，而且B表中数据倾斜特别严重，有一个key上有15亿行记录，在运行过程中特别的慢，而且会在reduce的过程中遇到内存不够而报错

解决方案：

考虑使用mapjoin，mapjoin会把小表全部读入内存中，在map阶段直接拿另外一个表的数据和内存中的表数据做匹配，将join操作放到map阶段，提高了运行效率，一定程度上可以解决数据倾斜问题

MapJoin:
hive> set hive.auto.convert.join=true; //默认为true，已经开启
hive.mapjoin.smalltable.filesize=25000000 //表文件的大小作为开启和关闭MapJoin的阈值

实际生产环境，我们可以通过set hive.mapjoin.smalltable.filesize的方式，提高开启MapJoin表文件的阈值，进而提高运行效率，解决数据倾斜的问题

leoxry

发布了544 篇原创文章 · 获赞 289 · 访问量 23万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/BlessingXRY/article/details/102652978

Hive - 问题 & 解决

Hive解决数据倾斜问题及Hive优化

Hive解决数据倾斜问题

hive解决了什么问题

hive解决小文件问题

hive遇到的问题以及解决办法

hive常见问题的解决

解决启动hive时报错问题

解决hive中数据倾斜问题

hive sql的问题解决

hive问题

Hive 问题

Hive 安装&配置及常见问题解决

hadoop hbase hive 常见问题解决

转:hive表Join的倾斜问题以及解决方法

hive load数据后，数据被搬移，问题解决

hive存储过程遇到的问题及解决办法

Hive常见问题及解决方案

Hive本地模式安装及遇到的问题和解决方案

Hive之小文件问题及其解决方案

Hive元数据中中文乱码问题排查解决

Hive中跑MapReduce Job出现OOM问题分析及解决

Hive性能优化--全面解决数据倾斜等问题

hive执行表操作指令卡死问题的解决

Hive性能优化（全面）解决数据倾斜等问题

hive过程中遇到mysql问题的解决

启动Hadoop和hive设备空间不足问题的解决

hive-jdbc获取查询日志慢的问题发现与解决

使用Sqoop将MySql to Hive问题解决记录

Hive中关于Mysql的问题解决方案

今日推荐

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

开源王者！全球最强的开源大模型Llama3发布！15万亿数据集训练，最高4000亿参数，数学评测超过GPT-4，全球第二！

为欧拉系统安装可视化界面(deepin）

MobaXterm中文版（MobaXterm-Chinese-Simplified）安装和使用

JS 网页全自动翻译 v3.4 发布，开放对 html 文件的翻译能力

这是Linus最忍不了的一集——虚幻引擎代码规范禁止使用脏话、禁止slave、master

与 Apollo 共创生态：观看7周年大会的心路历程

与 Apollo 共创生态：Apollo7周年大会的心得体会，干货满满

国内各种免费AI聊天机器人(ChatGPT)推荐(上)

周排行

一个电商SSH项目的笔记与总结

批量创建user用户

单点登录的实现方式

【前端3分钟】MVVM数据变更检测

Linux 中断学习总结

安卓手机微信不能打开App下载地址的问题微信跳转打开外部浏览器下载

HTML --盗版网页游戏

Mysql 悲观锁与乐观锁

linux下LCD驱动（一）-------LCD基础知识

Linux——设备树编译和反编译

每日归档

更多

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)