mapred.tasktracker.map.tasks.maximum 和 cpu核数的关系 - 代码天地

mapred.tasktracker.map.tasks.maximum 和 cpu核数的关系

企业开发 2018-05-14 22:31:53 阅读次数: 2

The number of tasks that can be run simultaneously on a tasktracker is related to the
number of processors available on the machine. Because MapReduce jobs are normally
I/O-bound, it makes sense to have more tasks than processors to get better
utilization. The amount of oversubscription depends on the CPU utilization of jobs
you run, but a good rule of thumb is to have a factor of between one and two more
tasks (counting both map and reduce tasks) than processors.
For example, if you had 8 processors and you wanted to run 2 processes on each pro-cessor, then you could set each of mapred.tasktracker.map.tasks.maximum and
mapred.tasktracker.reduce.tasks.maximum to 7 (not 8, since the datanode and the
tasktracker each take one slot). If you also increased the memory available to each child
task to 400 MB, then the total memory usage would be 7,600 MB

--《Hadoop: The Definitive Guide》

mapred.tasktracker.map.tasks.maximum 一般跟物理核数有关

如果有8个核，最好有16个线程或者进程，这样，每两个进程竞争一个核，系统CPU利用率最高
然后，每个tasktracker还有一些其他服务线程（Hadoop自带的），需要为这些进程预留1~2个核比较好

所以，如果有8个核，可以有2*8-2=14个task
这14个task，可按照你自己需求分，如：8个map slot，6个reduce slot
实际上，只考虑核是不行的，还需要考虑内存，磁盘等

如果你有8个核，但只有1G内存，如果跑16个task，则每个task只有64MB内存，你的task能跑起来吗？

以上为请教dongxicheng内容，感谢！ http://dongxicheng.org/

猜你喜欢

转载自zhb-mccoy.iteye.com/blog/1507746

mapred.tasktracker.map.tasks.maximum 和 cpu核数的关系

hadoop中mapred.tasktracker.map.tasks.maximum的设置

CPU核数和load average的关系

cpu个数、核数、线程数、Java多线程关系的理解+物理cpu数和cpu核数和逻辑cpu数和vcpu区别

cpu 物理核数和逻辑核数

查看CPU核数和内存

CUP核数和多线程的关系

线程数设置和CPU数的关系

Centos 查看 CPU 核数和型号和主频

linux查看cpu核数和内存指令

linux主机查看CPU核数和主机型号

Linux（查看服务cpu核数和内存）

线程数和cpu个数的关系

CPU核心数和线程数的关系

Linux下区分物理CPU、逻辑CPU和CPU核数

Linux系统物理CPU、逻辑CPU和CPU核数的区别

云主机核数、内存和运行性能的关系解析

进程、线程、CPU核数之间的关系

CPU核数跟多线程的关系

CPU的核心数、线程数的关系和区别

程序线程数设置和系统cpu的关系

【转载】如何用Linux的命令正确识别cpu的个数和核数

Android 系统（185）---如何使用adb command来设置cpu频率和核数

Linux-查看cpu核数和个数、查看内存的命令

通过shell获取系统启动时长和cpu核数命令

VC++获取CPU的名称、主频和核数（附源码）

CPU的核、进程和线程

【测试数据】android下CPU核与线程数的关系

查询CPU的核数

查看CPU的核数

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)