Hive(13):Hive与MR相关参数

其他 2018-11-12 00:42:29 阅读次数: 0

一、实现功能

如果核心数比较少，内存比较多，则可以每个reduce多设置内存，使一个核心处理能力增大；
如果核心数充足，则内存设置可以比较少，进而使多个核心处理任务，增加处理速度。

二、配置

1.In order to change the average load for a reducer (in bytes):
每个reduce能够处理的数据量，字节，默认是1个G

set hive.exec.reducers.bytes.per.reducer=<number>;
例如
set hive.exec.reducers.bytes.per.reducer=1000000000;

2.In order to limit the maximum number of reducers:
设置最大运行的reduce个数，默认999个

set hive.exec.reducers.max=<number>

3.In order to set a constant number of reducers:
设置实际运行reduce的个数（默认值是1，但是在配置文件里面是看不到的）

set mapreduce.job.reduces=<number>

4.hive-site.xml的配置：

<property>
  <name>hive.exec.reducers.bytes.per.reducer</name>
  <value>1000000000</value>
  <description>size per reducer.The default is 1G, i.e if the input size is 10G, it will use 10 reducers.</description>
</property>

<property>
  <name>hive.exec.reducers.max</name>
  <value>999</value>
  <description>max number of reducers will be used. If the one
    specified in the configuration parameter mapred.reduce.tasks is
    negative, Hive will use this one as the max number of reducers when
    automatically determine number of reducers.</description>
</property>

猜你喜欢

转载自blog.csdn.net/u010886217/article/details/83890799

Hive(13):Hive与MR相关参数

sparksql\hive on spark\hive on mr

Hive参数传递与相关函数

hive local mr转

hive本地mr

hive如何执行mr

Hive之MR优化

hive 执行引擎-tez和mr部分参数优化

Hive相关

Hive相关属性以及参数配置

hive和spark相关参数列表

HIVE参数

MR/hive 数据去重

【Hive十五】Hive IO相关

13、大数据之Hive参数配置与内置函数

Hive 基于MR引擎 map和reduce数的参数控制原理与调优经验

hive在YARN下执行mr任务问题

用hive或mr清洗app数据

细说Hive SQL触发MR的场景

MR和HDFS的高端封装--Hive

hive 中 join操作底层mr图解

重要 | mr使用hcatalog读写hive表

13_hive四-hive调优

CDH集群修改/设置hive的动态分区（dynamic）相关参数

hive 相关异常

HIVE锁相关

hive建表相关

hive相关语法与操作

hive相关的example

Hive 相关优秀文章

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)