Hive面试题6：动态分区 - 代码天地

Hive面试题6：动态分区

其他 2020-04-04 20:34:18 阅读次数: 0

面试时问的一道情景题：

假设我创建了一张表，其中包含了2016年客户完成的所有交易的详细信息，现在我插入了100万条数据，我想知道每个月的总收入。问：如何高效的统计出结果

写出步骤即可

分析：

首先分析这个需求，其实并不难，但是由于题目说了，要高效。而且数据量也不小,直接写sql查询估计肯定会挂。
我们可以通过根据每个月对表进行分区来解决查询慢的问题。因此，对于每个月我们将只扫描分区的数据，而不是整个数据集。
但是我们不能直接对现有的非分区表进行分区。

所以我们会采取以下步骤来解决这个问题：

假设现在的表是这样

CREATE TABLE transaction_details (id INT, amount FLOAT, month STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';

创建一个分区表，partitioned_transaction：

create table partitioned_transaction (id int, amount float) partitioned by (month string) row format delimited fields terminated by ‘,’ ;

在Hive中启用动态分区：

SET hive.exec.dynamic.partition = true;
SET hive.exec.dynamic.partition.mode = nonstrict;

将数据从非分区表导入到新创建的分区表中：

insert overwrite table partitioned_transaction partition (month) select id, amount, month from transaction_details;

使用新建的分区表实现需求。

SELECT month,sum(amount)
FROM partitioned_transaction partition by month;

主要是考察关于动态分区的知识，这个在实际的大数据场景中使用非常频繁。

Sql Boy

发布了35 篇原创文章 · 获赞 12 · 访问量 6634

私信关注

猜你喜欢

转载自blog.csdn.net/u012955829/article/details/102880383

Hive面试题6：动态分区

hive面试题

Hive面试题:Hive分区表和分桶表的区别

Hive面试题收集

hive相关面试题

Hive面试题5

Hive必考面试题

面试题（6）

面试题6

大数据面试题(五)----HIVE面试题

面试题-动态规划

面试题: !=!=未看6

java面试题6

java面试题(6)

大数据hive面试题

（九）Hive的5个面试题

Hive面试题：hql的执行流程

面试题：Hive on Spark与SparkSql的区别

大数据面试题——Hive篇

（七）Hive的5个面试题

Hive 面试题收集（未完）

经典Hive SQL面试题

Hive面试题1:复杂sql

HIVE-SQL经典面试题

Hive SQL 面试题-【高频&硬核】

Hive面试题：hive有哪些udf函数，作用

Hive面试题：hive调优的思路

【Hive】Hive 一些面试题

hive动态分区与静态分区

6.hive参数配置方法与动态分区

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)