【Spark-SparkSQL】SparkSQL 查询分区数据时会对Hive全表进行扫描（执行SparkSQL程序查询Hive数据时，开启动态资源分配导致分配资源过大，程序无法执行）

编程语言 2023-07-01 06:05:21 阅读次数: 0

问题描述：

SparkSQL 访问 Hive 分区数据时，会先对全表进行扫描，所以一旦 Hive 单表数据量过大，会导致申请的资源过多，程序一直请求不到资源，任务挂掉。

解决方式：（防止查询分区数据时对全表进行扫描）

SparkSession.sql("set spark.sql.hive.caseSensitiveInferenceMode=NEVER_INFER")

转载自blog.csdn.net/weixin_53543905/article/details/130639012

微软回应中国区AI团队“打包赴美”传闻

美国拟限制 AI 大模型出口中国和俄罗斯

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)