hadoop corrupt处理流程

企业开发 2018-06-01 20:55:36 阅读次数: 0

Datanode block corrupt流程说明

1、 Datanode上有一个线程DataBlockScanner对Datanode上面的block进行数据校验，其中该类中最重要的方法是verifyBlock(Block block)，在verifyBlock(Block block)方法中利用了BlockSender，其方法是将block读入到一个空设备(IOUtils.NullOutputStream())中，通过读写进行检验。

2、如果检验失败后handleScanFailure(Block block)，通过RPC直接向Namenode汇报存在坏块，即调用Namenode的reportBadBlocks(blocks)方法

3、Namenode向FSNamesystem转发调用markBlockAsCorrupt(Block blk,DatanodeInfo dn)，经过校验后将该block放置入neededReplications结构中，至此Datanode向Namenode汇报结束

4、 Namenode通过ReplicationMonitor线程，对block出现的问题(excess,neededreplica…)进行处理。该线程调用computeDatanodeWork()方法，该方法首先调用computeReplicationWork()方法。

5、在computeReplicationWork()方法中，从neededReplicaions结构中按照优先级构建出需要复制的block—blocksToReplicate，对每个block调用computeReplicationWorkForBlock()方法

6、随后调用ReplicationTargetChooser类的chooseTarget去获取目的主机，用于放置block

7、随后更改6中获得的DatanodeDescriptor的状态，将该block放置入需要replicate的队列中，同时pendingReplications加入该block准备复制

8、最后修改corrupt的block对应的DatanodeDescriptor状态，将该block置入invalidate队列中

9、再下一次心跳汇报时，会将对应的block已DatanodeCommand的形式，发送给datanode进行处理

注：集群中主机数需要大于相应副本数才会进行复制，对corrupt进行处理，否则第6步找不出目的主机

猜你喜欢

转载自sid1211.iteye.com/blog/1134072

hadoop corrupt处理流程

hadoop 漫画流程

hadoop安装及配置流程

hadoop 流程细节详解

hadoop配置流程

Hadoop 文件写流程

Hadoop 文件读流程

hadoop学习流程

Hadoop搭建流程

hadoop_yarn_流程

hadoop_MapReduce_流程

Hadoop提交作业流程

hadoop jobhistory开启流程

Hadoop Mapreduce运行流程

hadoop mapreduce流程

HADOOP的mapReduce流程解析

Hadoop的MapReduce流程

Hadoop：HDFS读写流程

Hadoop 重启流程

Hadoop jps正确使用流程及报错处理

hadoop-MapReduce处理流程（一）生活实例对比

hadoop报错处理

Hadoop的DistCp异常处理

hadoop链式处理

hadoop处理excel数据

Hadoop数据倾斜处理

Hadoop小文件处理

Hadoop 小文件处理

Hadoop崩溃处理

hadoop-----joblog读写流程

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)