Hadoop深入学习：HDFS主要流程——读数据 - 代码天地

Hadoop深入学习：HDFS主要流程——读数据

企业开发 2018-05-13 18:28:36 阅读次数: 0

本节我们将着重学习客户端是如何读取HDFS上的数据的操作过程。
查看HDFS上的文件内容的命令行操作：

             hadoop fs -cat example.txt

整个“读”流程如下图所示：

       1）、客户端通过FileSystem.open()打开文件，对应的HDFS具体的文件系统DistributedFileSystem创建一个输出流FSDataInputStream，返回给客户端；
       2）、到NameNode节点，获取要读文件的开始部分的数据块的保存位置，即上图中的第2步（NameNode节点中保存这这些数据块副本的DataNode节点的地址，这些数据节点根据他们与客户端的位置进行了简单的排序）；
       3）、客户端端调用FSDataInputStream会和里客户端最近的DataNode节点建立连接，由FSDataInputStream.read()方法读取文件数据；当达到该块儿的末端时，FSDataInputStream会关闭和当前DataNode节点的连接，并通过上图中的第5步获得下一数据块的节点信息，寻找最佳的数据节点，建立连接并再次通过FSDataInputStream.read()方法读取数据；
       4）、当度全完所有的文件信息后，关闭当前的输入流，完成读操作。
       在客户端读取文件时，如果DataNode数据节点发生了错误，如节点停机或网络故障，那么客户端会尝试写一个数据块副本的位置，同时会也记住出现故障的DataNode节点，不会在进行没用的尝试；但是入如果是数据块损坏，南无他会将这个信息包装到DataNode向NameNode节点发出的“心跳”中，向NameNode节点告知这一信息，同时，尝试从别的DataNode节点中读取这一个数据块的内容。

猜你喜欢

转载自flyingdutchman.iteye.com/blog/1874677

Hadoop深入学习：HDFS主要流程——读数据

Hadoop深入学习：HDFS主要流程——写文件

Hadoop深入学习：HDFS主要流程——SNN合并fsimage和编辑日志

Hadoop深入学习：HDFS主要流程——NameNode节点上的文件和目录操作

Hadoop深入学习：解析HDFS的写文件流程

hadoop HDFS 读数据流程

Hadoop（四）：HDFS读数据的基本流程

Hdfs读数据的流程

Hadoop学习十六：Hadoop-Hdfs DataXceiverServer源码读数据

HDFS读数据流程

大数据学习---Hadoop的深入学习

大数据之hadoop深入学习

Hadoop之HDFS的读数据与写数据

hdfs：写数据、读数据流程

Hadoop深入学习：Combiner

Hadoop深入学习：NameNode

Hadoop深入学习：重温

Hadoop深入学习：MapReduce

怎么hadoop深入学习？

Hadoop深入学习 Combiner

Hadoop深入学习：HDFS分布式文件系统的体系结构

HDFS写数据和读数据流程

大数据笔记 2--hdfs读数据流程

Hadoop深入学习：Map Task和Reduce Task的执行流程

Hadoop深入学习：MapReduce作业的提交流程和作业的生命周期

Hadoop深入学习：MapTask详解

Hadoop深入学习：Reduce组件详解

Hadoop深入学习：Mapper组件详解

Hadoop深入学习：MapReduce的编程模型

Hadoop深入学习：ReduceTask详解

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)