HDFS 读/写数据流程 - 代码天地

HDFS 读/写数据流程

其他 2019-05-28 22:11:27 阅读次数: 0

1. HDFS 写数据流程

客户端通过 Distributed FileSystem 模块向 NameNode 请求上传文件， NameNode 检查目标文件是否已存在，父目录是否存在；
NameNode 返回是否可以上传；
客户端请求NameNode,获取第一个 Block 上传到哪几个 DataNode 服务器上；
NameNode 返回3个 DataNode 节点，分别为 dn1, dn2, dn3；
客户端通过 FSDataOutputStream 模块请求 dn1 上传数据， dn1 收到请求会继续调用 dn2，然后 dn2 调用 dn3，将这个通信管道建立完成；
dn1, dn2, dn3 逐级应答客户端；
客户端开始往 dn1 上传第一个 Block （先从磁盘读取数据放到一个本地内存缓存），以 Packet 为单位， dn1 收到一个 Packet 就会传给 dn2， dn2 传给 dn3；dn1 每传一个 packet 会放入一个应答队列等待应答；
当一个 Block 传输完成之后，客户端再次请求 NameNode 上传第二个 Block 的服务器。（重复执行 3-7 步）。

1.1 网络拓扑--节点距离计算

在 HDFS 写数据的过程中， NameNode 会选择距离待上传数据最近距离的 DataNode 接收数据。
如何计算最近距离？
- 节点距离：两个节点到达最近的共同祖先的距离总和。

1.2 机架感知（副本存储节点选择）

2. HDFS 读数据流程

参考资料：

HDFS 文件IO流操作

猜你喜欢

转载自www.cnblogs.com/linkworld/p/10940512.html

HDFS 读/写数据流程

HDFS写数据流程

HDFS 写数据流程

HDFS的数据流（读和写）

hdfs：写数据、读数据流程

hadoop HDFS 写数据流程

图解Hadoop hdfs写数据流程

HDFS的写（读）数据流程、namenode和datanode工作机制总结

HDFS源码解析之HDFS写数据流程(九)

HDFS写数据和读数据流程

三十六、HDFS的写数据流程及网络拓扑概念

HDFS读写数据流程

HDFS读数据流程

大数据系列（2）HDFS写流程和读流程

Hdfs写数据的流程

HDFS写流程和读流程

hdfs的写流程和读流程

Hadoop理论——hdfs读、写流程

hadoop的HDFS读写数据流程

HDFS读写数据流程详解

hadoop HDFS 读数据流程

HDFS组成架构与读写数据流程

HDFS读取数据流程详解

Hadoop 之 HDFS (HDFS 数据流的读写流程)

大数据笔记 1--hadoop中的hdfs写数据流程详解

HDFS读文件流程

hdfs读流程

HDFS之读流程

hdfs 读流程

HDFS的数据流

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)