Hadoop学习十七：Hadoop-Hdfs DataXceiverServer源码写数据 - 代码天地

Hadoop学习十七：Hadoop-Hdfs DataXceiverServer源码写数据

企业开发 2018-05-12 15:02:21 阅读次数: 2

一.写数据

DataXceiver的writeBlock方法用于客户端(Client或DataNode)的写数据请求。

二.单一流程

读取客户端发送过来的消息(下文称之为“请求参数”)

blockId：要写入块的block id。
generationStamp：要写入块的block generationStamp。
pipelineSize：num of datanodes in entire pipeline.整个管道里的datanode数，默认为3。
isRecovery：是不是恢复操作。
clientName：如果是DataNode到DataNode的请求，clientName为空。
hasSrcDataNode：is src node info present.标识上一节点是DataNode。
DatanodeInfo：如果hasSrcDataNode，读取此DatanodeInfo。
numTargets：目标节点的数量。如果是Client的请求，则目标节点为3；如果是DataNode1的请求，则目标节点为2。
DatanodeInfo[]：每个目标节点。
checksum：校验数据。

根据上面要写入的block创建BlockReceiver。
创建流链，确保DataNode1到DataNode3都是通的。

mirrorOut：stream to next target
mirrorIn：reply from next target
mirrorNode：the name:port String of next target
mirrorSock：socket to next target
replyOut：stream to prev target
in：stream from prev target

调用BlockReceiver.receiveBlock(各种流)读取客户端数据写到本地，和读数据协议是一样的，参考http://zy19982004.iteye.com/blog/1881733。

三.整个流程

上述二是在某一节点上发生的行为，在整个写过程中，每个节点都会发生这个行为，于是形成了下列一个流程图。
当前节点会把writeBlock时接受到的请求参数通过mirrorOut继续发生给下一节点；下一节点收到请求，解析请求(二过程)，决定是否发生AC应答...
如果整个流通道建立了，DataNode1读取client的数据，写到硬盘上，并同时把此数据流继续发送给DataNode2...边收边传
当前节点是怎么知道下一节点的？从客户端发生过来的流里面，读取到了目标节点DatanodeInfo[]，mirrorNode = targets[0].getName();

一.写数据 二.单一流程 三.整个流程

猜你喜欢

转载自zy19982004.iteye.com/blog/1885461

Hadoop学习十七：Hadoop-Hdfs DataXceiverServer源码写数据

Hadoop学习十六：Hadoop-Hdfs DataXceiverServer源码读数据

Hadoop学习十五：Hadoop-Hdfs DataXceiverServer源码概述

Hadoop学习二十七：Hadoop-Hdfs 权限相关源码

Hadoop学习十八：Hadoop-Hdfs DataXceiverServer源码其它操作及总结

Hadoop学习二十二：Hadoop-Hdfs INode源码

Hadoop学习十四：Hadoop-Hdfs FSDataset源码

Hadoop学习二十六：Hadoop-Hdfs Lease源码

Hadoop学习二十五：Hadoop-Hdfs FSImage源码

Hadoop学习八：Hadoop-Hdfs RPC源码 Client

Hadoop学习六：Hadoop-Hdfs源码 classification包

Hadoop学习二十四：Hadoop-Hdfs FSEditLog 源码

Hadoop学习十三：Hadoop-Hdfs DataStorage源码

Hadoop学习十二：Hadoop-Hdfs Storage源码

Hadoop学习九：Hadoop-hdfs RPC源码 Server

Hadoop学习二十三：Hadoop-Hdfs FSDirectory 源码

Hadoop学习二十一：Hadoop-Hdfs DataNode 源码

Hadoop学习十：Hadoop-Hdfs RPC源码 RPC

Hadoop学习七：Hadoop-Hdfs源码 conf包

Hadoop-HDFS读写数据

大数据学习笔记之Hadoop-HDFS

5.大数据学习之旅——hadoop-HDFS

hadoop-HDFS的数据流

Java大数据开发：Hadoop-HDFS

Hadoop学习二十九：Hadoop-hdfs NameNode源码成员变量

Hadoop学习二十八：Hadoop-hdfs FSNamesystem源码成员变量

Hadoop-HDFS学习

Hadoop-HDFS的数据读写过程（详细过程与图解）

HADOOP-HDFS学习一

尚硅谷大数据技术Hadoop教程-笔记03【Hadoop-HDFS】

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)