Hive分区 - 代码天地

Hive分区

移动开发 2018-05-25 02:21:07 阅读次数: 9

hive分区是对hive表的一种组织形式，可以加快查询，是一种对表进行粗略划分的机制，使用分区时，在表目录下会有相应的子目录，当查询时若添加了分区谓词，该查询会定位到相应的字目录下进行查询，避免了全表扫描，比如日志文件分析，将日志按天存储。分区并不会影响大范围的查询。

外部表也可以分区，具有良好的灵活性，例如：
这种灵活性的一个有趣的优点是我们可以使用像Amazon S3这样的廉价的存储设备存储旧的数据，同时保存较新的更加“有趣的”数据到HDFS中。例如，每天我们可以使用如下的处理过程将一个月前的旧数据转移到S3中。

1.将分区下的数据拷贝到S3中。例如，用户可以使用hadoop distcp命令：

hadoop distcp /data/log_messages/2011/12/02 s3n: //ourbucket//logs/2011/12/02

2.修改表，将分区路径指向到S3路径：

ALTER TABLE log_messages PARTITION(year = 2011, month = 12, day = 2)
SET LOCATION 's3n://ourbucket/logs/2011/01/02';

3.使用 hadoop fs -rmr 命令删除HDFS中的这个分区数据：

hadoop fs -rmr /data/log_messages/2011/01/02

猜你喜欢

转载自my.oschina.net/134596/blog/1798986

Hive分区

Hive 分区

hive的分区

hive动态分区与静态分区

hive学习(三) hive的分区

【Hive】Hive分区表

Hive分区（静态分区+动态分区）

hive 分区表

hive分区表

hive查询和分区

Hive 表分区

hive分区操作

Hive动态分区

hive笔记-刷新分区

hive分区导入

Hive 删除分区的方法

Hive分区查询

hive 表的分区

Hive分区参数配置

Hive动态分区配置

hive 分区详解

hive计划（二）分区

## Hive分区、桶、与倾斜

hive修改分区信息

Hive分区partition详解

Hive -分区表

HIVE --- 分区表

Hive分区与分桶

Hive 分区（Partition）

HIVE分区常用操作

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)