大数据开发之Hadoop篇----hdfs读流程 - 代码天地

大数据开发之Hadoop篇----hdfs读流程

其他 2018-10-18 17:36:24 阅读次数: 0

读流程所涉及到的有client，NameNode和DataNode这个三个，我们来了解下这三个之间在读流程里都是干什么的。

1，当我们输入一条读入数据的命令的时候，如：hdfs dfs -ls / 或者 hdfs dfs -cat /user/hadoop/xxx时，client就通过DistributedFileSystem这个对象的open方法去和NameNode进行rpc通信，其中open方法会将一个path路径传递过去，这个path路径就是我们要查看的文件或者文件夹的路径。NameNode会对这个path进行交验，判断是否存在这个路径以及你要读取的路径你是否拥有权限去读取，如果都没问题的话就接着第二步，否则报错。

2，交验完成后，NameNode将会返回要读取的文件的全部或者一部分block列表(其实就是返回一个FSDataInputStream对象)，这些就是blockmap的内容嘛，还记不记得前几篇的有介绍到hdfs的写流程，其中说到DataNode会返回心跳包给NameNode以及每隔10个心跳包就会返回一个blockmap给NameNode，里面就记录了每个文件所对应的block以及其存储的节点位置。

3，client调用FSDataInputStream对象的read方法去读取每一个block最近地址的副本(虽然有多个副本但是并不是要读取全部副本的，所以会根据一个算法来读取离client最近节点上的副本)，读取完成后回去交验这个block是否有损坏，假如没有任何问题会自动关闭与当前DataNode的通信。如果check失败了，会记录下这个受损的block在哪个DataNode节点上，下次不会再读取了。

4，然后就是下个block的读取，当我们把block列表里面的block读取完后，文件还没有结束将继续向NameNode申请下一批block列表。

5，最后client调用FSDataInputStream对象的close方法关闭输入流。

猜你喜欢

转载自blog.csdn.net/weixin_39702831/article/details/83089266

大数据开发之Hadoop篇----hdfs读流程

大数据开发之Hadoop篇-----hdfs shell脚本

大数据开发之Hadoop篇----hdfs读写权限操作

大数据开发之Hadoop篇----hdfs dfsadmin命令

大数据开发之Hadoop篇----HDFS java API

Hadoop之HDFS的读流程

大数据开发之Hadoop篇----hdfs垃圾回收机制配置

大数据 Hadoop之HDFS

大数据Hadoop之HDFS

大数据之Hadoop（HDFS）

大数据-hadoop之HDFS

大数据技术之Hadoop之HDFS(7)——HDFS读写数据流程

大数据系列（2）HDFS写流程和读流程

大数据开发之Hadoop篇----提交作业到yarn上的流程

HDFS之读流程

大数据之Hadoop（十）：hadoop概念扩展——HDFS 读写流程以及高可用

大数据开发之Hadoop篇----初始Hadoop

Java大数据开发：Hadoop-HDFS

大数据学习之hadoop——06HDFS文件系统读写数据流程

大数据 05 Hadoop之HDFS

大数据Hadoop之HDFS模块《》

大数据Hadoop之HDFS模块《二》

大数据技术之Hadoop（HDFS）

大数据Hadoop之HDFS概述

大数据技术之Hadoop(HDFS)

大数据技术之Hadoop之HDFS(1)——HDFS概述

大数据技术之Hadoop（HDFS）概述、Shell操作、API操作、读写流程、工作机制

Hadoop大数据 --HDFS

大数据：Hadoop（HDFS 读写数据流程及优缺点）

Hadoop 之 HDFS (HDFS 数据流的读写流程)

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)