Hive动态分区表使用 - 代码天地

Hive动态分区表使用

其他 2019-03-24 14:11:05 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/BAStriver/article/details/87980427

1.有时候为了更方便地根据某个时间字段来进行增量更新数据，我们可以使用分区。而相对来说，这种时候用动态分区会多一些。

2.首先，先进入Hive命令行，输入一下的设置，打开动态分区功能：

set hive.exec.dynamic.partition =true; 
-- 表示开启动态分区功能

set hive.exec.dynamic.partition.mode = nonstrict;
-- 表示允许所有分区都是动态的，否则必须有静态分区字段

3.下面为Hive动态分区参数：

set  hive.exec.max.dynamic.partitions.pernode=100; 
-- (默认100)表示每个maper或reducer可以允许创建的最大动态分区个数，默认是100，超出则会报错。

set hive.exec.max.dynamic.partitions =1000;
-- (默认1000)表示一个动态分区语句可以创建的最大动态分区个数，超出报错

set hive.exec.max.created.files =10000
-- (默认10000) 全局可以创建的最大文件个数，超出报错。

4.接下来，新建一个Hive表：

-- 普通不分区的Hive表
CREATE TABLE table_part(
field1 string,
field2 string,
time string
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY "\t";


-- 动态分区
CREATE TABLE table_part(
field1 string,
field2 string
)
PARTITIONED BY (time string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY "\t";

其中，我们注意到，分区字段写在PARTITIONED BY中，在建表字段中就不用写了，这样建之后，time字段是补在最后面的。

5.查看表分区信息：

show partitions table_part;

6.删除表分区：

alter table table_part drop partition (time='2019-02');

7.查询分区数据：

select field1, field2 , time from table_part 
where time='2019-02';


-- 分区显示数据
select  field1, field2 , time from table_part distribute by time;

8.插入数据到分区表：

insert into table table_part partition(time)
select field1 , field2 , time from table;

-- 注：select 子句最后一列要为分区表的分区列

部分参考：

1.https://blog.csdn.net/zwjzqqb/article/details/79022251

2.https://blog.csdn.net/qq_26442553/article/details/80382174

猜你喜欢

转载自blog.csdn.net/BAStriver/article/details/87980427

Hive动态分区表使用

Hive分区表的使用

hive 分区表

hive分区表

Hive -分区表

HIVE --- 分区表

hive的分区表

使用动态分区的方式为Hive中的分区表加载数据

【Hive】Hive分区表

hive静态分区表，动态分区表详解，案例demo

Hive动态分区表的学习测试与总结

【大数据】Hive系列之- Hive-分区表(静态分区和动态分区)

大数据技术Hive分区表静态分区&动态分区表$多级分区（第二篇）

转：hive分区表

hive 多级分区表

hive之分区表

Hive分区表简介

hive修改分区表

Hive DML ，分区表

Hive中的分区表

hive新建分区表

Hive分区表总结

Hive_分区表

创建Hive分区表

hive的分区表设计

HIVE 分区表详解

Hive的分区概念、分区表创建、分区信息修改、动态分区案例——千峰视频

Hive-分区表，二级分区，动态分区，分桶表

hive中分区表(partition table)：动态分区(dynamic partition)和静态分区(static partition)

【Hive】Hive分区表详解

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)