HDFS文件上传与下载原理 - 代码天地

HDFS文件上传与下载原理

其他 2019-04-25 15:34:51 阅读次数: 0

HDFS上传文件

1客户端向HDFS(NameNode)文件系统发送文件上传请求。
2.NameNode检索HDFS文件系统是否存在与要上传文件相同的文件，如果存在，阻止该文件上传；如果不存在，允许该文件上传。
3.客户端上传文件，NameNode会找出空闲的DataNode节点存储文件(默认备份为3份，所以NameNode会找出3个空闲的DataNode节点)，NameNode的存储策略，本地存储一份，同一机架其他某与节点存储一份，不同机架其他某节点存储一份。
4.NameNode会将找出的空闲DataNode的地址反馈给客户端(反馈DataNode的地址会按照网络拓扑距离来排序，离客户端近的排在前面)。
5.客户端得到地址后，会按照网络拓扑距离的远近依次创建管道（管道：客户端——>DataNode1——>DataNode2——>DataNode3），管道创建好后，通知客户端开始传输数据。
6.客户端会根据上传文件的大小，分块传输；并且每块在传输时，以packet(64KB)为单位发送数据。
7.各DataNode在存储数据时，会反向(与管道方向相反)逐个发送ack(校验)至客户端。

HDFS文件下载

1.客户端向HDFS(NameNode)文件系统发送文件下载请求。
2.NameNode检索HDFS文件系统是否存在要下载的文件，如果存在，NameNode会将该文件的所以元数据反馈给客户端；如果不存在，不允许客户端下载该文件(提示客户端该文件不存在)。
3.客户端在获取元数据后，会与对应的DataNode创建线程(线程:客户端——>DataNode1，客户端——>DataNode2，客户端——>DataNode3),创建好线程后，开始下载数据。
4.客户端在下载完数据后，会将文件块进行合并，恢复成一个完整的文件。

猜你喜欢

转载自blog.csdn.net/weixin_38613375/article/details/89228650

HDFS文件上传与下载原理

hdfs文件上传于文件下载

hdfs文件上传及下载的流程

HDFS上传/下载数据的过程和原理

HDFS的API操作-文件的上传和下载

HDFS文件的上传和读取原理

hadoop从本地上传，下载文件到hdfs里面

hdfs文件上传下载--client模式--Kerberos认证

AngularJS + SpringMVC 多文件 HDFS 上传和下载

hdfs显示、查看、下载、上传、删除文件操作

使用HDFS的JavaApi,实现文件的新建上传和下载

Hadoop之HDFS的应用（Java API实现文件上传与下载）

mapreduce 的工作原理以及 hdfs 上传文件的流程

java文件上传和下载的原理

Java文件上传下载原理

HDFS文件上传流程

HDFS上传文件

hadoop原理加强之HDFS读写流程[上传下载流程和原理]

【Hadoop】HDFS操作、数据上传与下载原理解析、高级特性及底层原理

HDFS的上传与下载（put & get）

HDFS：文件IO流下载操作(把本地磁盘的文件上传到HDFS的目录，把HDFS上文件上传到本地磁盘上）

hdfs读写文件原理

HDFS的Java Api操作【获取Hdfs文件系统、遍历、创建文件和文件夹、上传、下载、权限访问控制、合并上传或下载】

HDFS（五）—— HDFS 文件上传的过程

HDFS的API操作(文件上传下载删除名更改详情查看文件夹的判断 )

Hadoop——HDFS文件系统的Java API操作（上传、下载、查看、删除、创建文件）详细教学

hdfs批量上传下载文件和删除指定目录下文件

HDFS的基本操作（创建目录或文件、查看目录或文件、上传和拷贝文件到HDFS上、追加数据到HDFS上、从HDFS上下载文件到Linux本地、合并HDFS文件）

JAVA上传文件到HDFS

Hadoop hdfs上传文件错误

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)