【大数据】Hive系列之- Hive-分桶表

移动开发 2023-07-18 18:48:37 阅读次数: 0

分桶表

分桶表

分桶表

分区提供一个隔离数据和优化查询的便利方式。不过，并非所有的数据集都可形成合理的分区。对于一张表或者分区，Hive 可以进一步组织成桶，也就是更为细粒度的数据范围划分。
分桶是将数据集分解成更容易管理的若干部分的另一个技术。分区针对的是数据的存储路径；分桶针对的是数据文件。

先创建分桶表

数据准备

100	ss1
1	ss2
100	ss3
2	ss4
100	ss5
3	ss6
100	ss7
4	ss8
100	ss9
5	ss10
100	ss1

创建分桶表

hive (default)> create table car_bucket(id int, name string) clustered by(id)
into 4 buckets
row format delimited fields terminated by '\t';

查看表结构

hive (default)> desc formatted car_bucket;
Num Buckets:	4

导入数据到分桶表中，load 的方式

hive (default)> load data inpath '/car.txt' into table car_bucket;

分桶规则

根据结果可知：Hive 的分桶采用对分桶字段的值进行哈希，然后除以桶的个数求余的方式决定该条记录存放在哪个桶当中

分桶表操作需要注意的事项

reduce 的个数设置为-1,让 Job 自行决定需要用多少个 reduce 或者将 reduce 的个数设置为大于等于分桶表的桶数
从 hdfs 中 load 数据到分桶表中，避免本地文件找不到问题
不要使用本地模式

insert 方式将数据导入分桶表

hive(default)>insert into table car_bucket select * from car_tmp;

猜你喜欢

转载自blog.csdn.net/u013412066/article/details/129540418

【大数据】Hive系列之- Hive-分桶表

Hive-分区表，二级分区，动态分区，分桶表

Hive-桶排序

hive 分桶表

Hive的分桶表

Hive分桶表

【大数据】Hive系列之- Hive-分区表(静态分区和动态分区)

Hive-表

大数据Hive系列之Hive MapReduce

大数据Hive系列之Hive API

hive中的分桶表

Hive分桶表的总结

HIve 创建分桶表

Hive（10）：Hive分桶表

大数据学习笔记42：Hive - 分桶表

大数据技术之数据仓库工具Hive分区表和分桶表

大数据技术之Hive（三）查询、分区表和分桶表

【Hive大数据】Hive分区表与分桶表使用详解

Hive-分区分桶操作

Hive-分区分桶概述

大数据面试系列之——Hive

【大数据系列】之Hive DDL and DML

【大数据】Hive系列之- Hive-DML 数据操作

【大数据】Hive系列之- Hive-DDL 数据定义

Hive常用函数和分桶表

Spark 读写Hive分桶表

简单Hive分桶表使用

Hive表的分桶和分区

hive排序，分区表，分桶表，hive函数

大数据Hive系列之Hive常用SQL

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)