【若泽大数据实战第十一天】HDFS详解二之副本放置策略 - 代码天地

【若泽大数据实战第十一天】HDFS详解二之副本放置策略

其他 2019-03-02 14:05:51 阅读次数: 0

副本放置策略

假设在数据中心的一个机架上面有5个服务器。一般正常的机架放10个，为什么10个，这个是按照机架的电量去算的，每个服务器分配多少安培的电流，一个机柜的电流安培数是有标准的，一个机柜的电流大小除以一个服务器的电流大小，算一个估算值。】

正常情况下，就是三个副本。副本不是越多越好，越多，需要的存储空间就大了，而且写的越慢。

第一个副本：

放置在上传的DN节点上，比如现在用client客户端上传的文件提交到HDFS上面，上传的那台机器正好是DataNode节点，会优先在自己所在的节点上上传一个副本，这样就不需要通过网络IO通过网线去传输数据包，这样会节省时间。

如果是集群外提交，则随机挑选一台磁盘不太慢、CPU不太忙的节点上。（老大NN是知道哪些节点是空闲的，会返回地址列表让你去上传）。

第二个副本：

放置在与第一个副本不同的机架的节点上。

第三个副本：

放置在与第二个副本相同机架的不同节点上。

假如还有更多的副本，就随机放，随机放在节点上。

生产上尽量将上传数的动作，读写的动作选取DataNode节点上。优先自己，这样减少网络带宽消耗，减少时间。

面试题:
集群上有DataNode 3个，其中一个DataNode挂了，那么一个文件有三个副本，
那么我现在能够正确读取文件内容吗？

待补充........

（网上：第一不会给储存带来影响，因为有其他的副本保存着，不过建议尽快修复，第二会影响运算的效率，机器少了，reduce在保存数据时选择就少了，一个数据的块就大了所以就会慢。）

其中DataNode挂了其实就是block Miss，那么怎样去修复？

1.手动修复
参考：https://blog.csdn.net/high2011/article/details/72461376

hdfs |grep debug

hdfs debug
Usage: hdfs debug <command> [arguments]

verify [-meta <metadata-file>] [-block <block-file>]
recoverLease [-path <path>] [-retries <num-retries>]

2.自动修复
参考：https://www.cnblogs.com/prayer21/p/4819789.html

猜你喜欢

转载自blog.csdn.net/liweihope/article/details/88058337

【若泽大数据实战第十一天】HDFS详解二之副本放置策略

【若泽大数据实战第十一天】HDFS详解二之HDFS读写流程

【若泽大数据实战第十一天】HDFS详解

【若泽大数据实战第十一天】HDFS文件的读写操作剖析

【若泽大数据实战第十天】HDFS详解一之HDFS架构设计

【若泽大数据Hadoop实战】Hadoop：4、HDFS详解

【若泽大数据实战第十天】HDFS详解一之hosts文件剖析和block块剖析

【若泽大数据实战第十二天】MapReduce学习

hdfs之副本放置策略

若泽大数据实战学习--开始

【若泽大数据实战第一天】大数据测试平台搭建

【若泽大数据实战第二天】Linux命令基础

【若泽大数据实战第二天】Linux基础命令

【若泽大数据实战第三天】Linux基础命令二

【若泽大数据实战第十天】Hadoop伪分布式部署 HDFS （hadoop用户）

【若泽大数据实战第十天】Hadoop用户重新部署伪分布式（HDFS）

【若泽大数据实战第九天】hdfs三个进程以机器名启动的设置

【若泽大数据实战第十天】Hadoop jps 详解 - jps报27342 -- process information unavailable

HDFS副本放置策略

【若泽大数据实战第一天】大数据测试Linux平台搭建以及Linux命令基础

【若泽大数据实战第九天】Hadoop伪分布式模式部署 HDFS（root用户）

【若泽大数据实战第十天】Hadoo官网使用教程

【若泽大数据实战第七天】MySQL在DBeaver上的使用

【若泽大数据实战第九天】Hadoop 编译

【若泽大数据实战第九天】MapReduce job运行案例

【若泽大数据实战第八天】hadoop入门介绍

【若泽大数据实战第五天】MySQL部署

【若泽大数据实战第四天】Linux命令进阶

【若泽大数据实战第三天】Linux命令进阶

数据结构【第十一天】：图（二）

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)