浅谈HDFS读写数据过程内部原理 - 代码天地

浅谈HDFS读写数据过程内部原理

其他 2018-06-04 00:12:18 阅读次数: 6

浅谈HDFS读写数据过程内部原理

文章开始把我喜欢的这句话送个大家：这个世界上还有什么比自己写的代码运行在十万人的电脑上更酷的事情吗，如果有那就是让这个数字再扩大十倍。

本文将详细解释HDFS读写数据过程中系统底层究竟发生了什么以及其具体实现，希望可以帮助理解。

首先读数据过程：

HDFS客户端发出读数据命令之后

configuration conf =new Configration();//配置文件,加载core-site.xml hdfs-site.xml 得到读写的地址

FileSystem fs=FileSystem.get(conf);//这一过程在底层实际上完成了FileSystem抽象类生成子类Distributed Filesystem 并实例化对象fs 的过程,真正对分布式文件进行操作的也是DistributedFileSystem的对象fs

path filename=new Path("url");

FSDataInputStream is=fs.open(filename);//此时会在内部创建一个输入流FSDateInputStream,输入流FSDateInputStream对应着底层的DFSDateInputStream,由这个DFSInputStream 来对底层操作调用 ClientProtocal.getBlockLocation()方法得到NameNode的地址，进而得到 DataNode的地址，完成读的过程

而当读取的文件占用超过一个数据块时，会重复进行该过程读取剩下的文件所在的数据块。

以上便是读取数据的过程，我们可以发现操作数据的并不是我们程序员直接接触的FileSystem FSDataInputStream 等类，而是他们在底层对应的DistributedFileSystem以及DFSDataInputStream.

附上流程图：

写入的过程与读的过程类似，不在附加说明，唯一不同的是写入数据时HDFS采取流水线方法，当FSDataOutputStream 将数据写入第一个节点之后，会由第一个节点向第二个节点写入数据，一次向后达到备份的目的。

附上流程图：

加油吧，程序员！！！

猜你喜欢

转载自blog.csdn.net/weixin_42248302/article/details/80475539

浅谈HDFS读写数据过程内部原理

HDFS读写数据过程原理分析

HDFS数据的读写过程

Hadoop - HDFS原理：HDFS 读写数据

HDFS数据存储与读写过程

HDFS数据存储与读写过程

HDFS读写数据过程解析及编程实现

【Hadoop】03-HDFS读写数据原理

hdfs读写文件过程

HDFS读写过程

hdfs的读写过程

Hadoop-HDFS的数据读写过程（详细过程与图解）

HDFS读写原理

HDFS的读写原理

hdfs读写文件原理

hadoop hdfs内部原理

HDFS上传/下载数据的过程和原理

HDFS启动及读写过程

HDFS读写数据

HDFS数据的读写流程

草图之----HDFS读写原理

Hadoop之HDFS读写原理

浅谈Thrift内部实现原理

【大数据day10】——Hadoop 核心-HDFS（HDFS 的架构，HDFS的副本机制和机架感知，hdfs的高级使用命令， HDFS基准测试，HDFS 文件读写过程，HDFS 的元数据辅助管理）

HDFS读写数据流程

Hadoop-HDFS读写数据

Review HDFS数据读写流程

Hadoop之HDFS文件读写过程

hdfs读写删除过程解析

HDFS数据的写入过程

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)