Hive中join的三种方式 - 代码天地

Hive中join的三种方式

其他 2019-01-23 01:29:48 阅读次数: 0

一.common join

common join也叫做shuffle join，reduce join操作。适用于两个table的大小相当，但是又不是很大的情况下使用。具体流程就是在map端进行数据的切分，一个block对应一个map操作，然后进行shuffle操作，把对应的block shuffle到reduce端去，再逐个进行联合。

缺点：容易产生数据倾斜，大数据量下性能不好

二.map join

mapJoin的主要意思就是，当join的两个表是一个比较小的表和一个特别大的表的时候，我们把比较小的table直接放到内存中去，然后再对比较大的表格进行map操作。join就发生在map操作的时候，每当扫描一个大的table中的数据，就要去去查看小表的数据，哪条与之相符，继而进行连接。这里的join并不会涉及reduce操作。

缺点：小表不能太大，吃内存

三.SMB(Sort-Merge-Buket) Join

smb是sort merge bucket操作，首先进行排序，继而合并，然后放到所对应的bucket中去，bucket是hive中和分区表类似的技术，就是按照key进行hash，相同的hash值都放到相同的buck中去。在进行两个表联合的时候。我们首先进行分桶，在join会大幅度的对性能进行优化。也就是说，在进行联合的时候，是table1中的一小部分和table1中的一小部分进行联合，table联合都是等值连接，相同的key都放到了同一个bucket中去了，那么在联合的时候就会大幅度的减小无关项的扫描。
set hive.auto.convert.sortmerge.join=true

set hive.optimize.bucketmapjoin=true;

set hive.optimize.bucketmapjoin.sortedmerge=true;

在执行任务时，可以通过设置相关参数，手工选择join方式

猜你喜欢

转载自blog.csdn.net/sinat_17697111/article/details/84323218

Hive中join的三种方式

【Hive】Hive的三种Join方式

Hive的三种Join方式

Hive的三种join

hive入门学习：join的三种优化方式

Hive中三种Join连接方式

Hive中的三种不同的数据导出方式介绍

hive 中创建表的三种方式

Hive中metastore的三种方式区别和搭建

Hive metastore三种配置方式

Hive 三种配置方式

hive 三种启动方式及用途

Hive的三种启动方式及用途

Hive metastore三种存储方式

hive脚本的三种执行方式

hive 三种搭建方式

hive的三种连接方式

hive的三种交互方式

Spark的join实现的3种方式(与Hive中的join对比)

Hive专题三--Hive的三种使用方式

Hive学习(一)Hive的三种搭建方式

Spark SQL join的三种实现方式

corss、inner、outer三种join方式

Hive的meta 数据支持以下三种存储方式

hive中文件三种压缩方式

Hive之——metastore三种配置方式（转）

Hive三种不同的数据导出的方式

简述Hive的三种启动方式及内置服务

Hive启动的三种方式 —悟空智慧教育

SQL（HIVE -HUE）剔除的三种方式

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)