hdfs深入：07、hdfs的文件的读取过程 - 代码天地

hdfs深入：07、hdfs的文件的读取过程

其他 2019-05-29 23:18:14 阅读次数: 0

详细步骤解析

1、 Client向NameNode发起RPC请求，来确定请求文件block所在的位置；

2、 NameNode会视情况返回文件的部分或者全部block列表，对于每个block，NameNode 都会返回含有该 block 副本的 DataNode 地址；这些返回的 DN 地址，会按照集群拓扑结构得出 DataNode 与客户端的距离，然后进行排序，排序两个规则：网络拓扑结构中距离 Client 近的排靠前；心跳机制中超时汇报的 DN 状态为 STALE，这样的排靠后；

3、 Client 选取排序靠前的 DataNode 来读取 block，如果客户端本身就是DataNode,那么将从本地直接获取数据(短路读取特性)；

4、底层上本质是建立 Socket Stream（FSDataInputStream），重复的调用父类 DataInputStream 的 read 方法，直到这个块上的数据读取完毕；

5、当读完列表的 block 后，若文件读取还没有结束，客户端会继续向NameNode 获取下一批的 block 列表；

6、读取完一个 block 都会进行 checksum 验证，如果读取 DataNode 时出现错误，客户端会通知 NameNode，然后再从下一个拥有该 block 副本的DataNode 继续读。

7、 read 方法是并行的读取 block 信息，不是一块一块的读取；NameNode 只是返回Client请求包含块的DataNode地址，并不是返回请求块的数据；

8、最终读取来所有的 block 会合并成一个完整的最终文件。

猜你喜欢

转载自www.cnblogs.com/mediocreWorld/p/10946872.html

hdfs深入：07、hdfs的文件的读取过程

hadoop hdfs 文件写入/读取过程解析

剖析HDFS文件的读取

HDFS读取文件详解

HDFS读取文件的流程

hdfs读写文件过程

HDFS写文件过程

云计算(二)HDFS读取文件的具体过程

Hadoop学习——hdfs上传读取删除文件的过程

记录Java读取hdfs上的文件全过程

HDFS（六）—— HDFS 文件下载的过程

HDFS（五）—— HDFS 文件上传的过程

在Eclipse中从HDFS读取文件

HDFS-文件读取API

Spark HadoopRDD读取HDFS文件

浅谈HDFS的文件读取与写入

HDFS(五)：文件读取解析

Spark读取与保存hdfs文件

Spark读取HDFS路径文件

《深入HDFS》--HDFS缓存

HDFS写文件过程分析

利用 HDFS 的 URL 方式读取 HDFS 内文件内容

MapReduce从HDFS读取文件聚合后写入HDFS的实现

读取hdfs文件系统中的文件

Spark读取本地文件和HDFS文件

《深入HDFS》--HDFS内存存储

《深入HDFS》HDFS异构存储

hdfs上文件的读取和写入

hadoop中hdfs读取文件的原理剖析

使用java读取gz压缩的hdfs文件

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)