HDFS面试题：hdfs写数据的流程 - 代码天地

HDFS面试题：hdfs写数据的流程

其他 2018-11-30 08:41:04 阅读次数: 0

版权声明：版权声明：本文为博主原创文章，转载请附上博文链接！ https://blog.csdn.net/qq_42246689/article/details/84637894

1、使用HDFS提供的客户端Client，向远程的Namenode发起RPC请求

2、Namenode会检查要创建的文件是否已经存在，创建者是否有权限进行操作，成功则会为文件创建一个记录，否则会让客户端抛出异常；

3、当客户端开始写入文件的时候，客户端会将文件切分成多个packets，并在内部以数据队列“data queue（数据队列）”的形式管理这些packets，并向Namenode申请blocks，获取用来存储replicas的合适的datanode列表，列表的大小根据Namenode中replication的设定而定；

4、开始以pipeline（管道）的形式将packet写入所有的replicas中。开发库把packet以流的方式写入第一个datanode，该datanode把该packet存储之后，再将其传递给在此pipeline中的下一个datanode，直到最后一个datanode，这种写数据的方式呈流水线的形式。

5、最后一个datanode成功存储之后会返回一个ack packet（确认队列），在pipeline里传递至客户端，在客户端的开发库内部维护着"ack queue"，成功收到datanode返回的ack packet后会从"ack queue"移除相应的packet。

6、如果传输过程中，有某个datanode出现了故障，那么当前的pipeline会被关闭，出现故障的datanode会从当前的pipeline中移除，剩余的block会继续剩下的datanode中继续以pipeline的形式传输，同时Namenode会分配一个新的datanode，保持replicas设定的数量。

7、客户端完成数据的写入后，会对数据流调用close()方法，关闭数据流；

猜你喜欢

转载自blog.csdn.net/qq_42246689/article/details/84637894

HDFS面试题：hdfs写数据的流程

HDFS面试题

Hdfs写数据的流程

大数据面试题(二)----HDFS面试题

Hadoop系列——HDFS相关架构，面试题，读数据/写数据/SecondaryNameNode的工作机制

Hdfs面试题1

HDFS写数据流程

HDFS 写数据流程

大数据：HDFS面试题收集（五）

【图文详细】HDFS面试题：什么是大数据

大数据常见面试题之hdfs

大数据面试题：HDFS存储原理

【图文详细】HDFS面试题：hdfs 的数据压缩算法？

HDFS—常见面试题

HDFS源码解析之HDFS写数据流程(九)

hdfs：写数据、读数据流程

HDFS写数据的详细流程

hadoop HDFS 写数据流程

HDFS 读/写数据流程

图解Hadoop hdfs写数据流程

Hadoop（三）HDFS写数据的基本流程

HDFS写文件流程

hdfs写操作的流程

HDFS的写文件流程

HDFS的写流程

HDFS写流程

hadoop几个常见的面试题总结(client与hdfs读写流程交互)

【大数据面试宝典】第二篇 HDFS 面试题

Hadoop之HDFS数据写流程和写失败的情况

大数据系列（2）HDFS写流程和读流程

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)