《hadoop权威指南第二版》读书疑问(1)

第二章数据流部分,其中有段描述如下:

最佳分片大小应该与块大小相同,因为它是确保可以存储在单个节点上的最大输入块大小。如果分片跨越两个数据块,那个对任何一个HDFS节点,基本上都不可能同时存储这两个数据块,因为分片中的部分数据需要通过网络传输到map任务节点。

本人刚刚开始学些hadoop,对红色高亮部分不甚了解,望高手指教。

问题补充:

一个节点是否只有一个map任务运行?

猜你喜欢

转载自derekzhi.iteye.com/blog/2057301
今日推荐