HDFS写入过程 - 代码天地

HDFS写入过程

企业开发 2018-05-07 02:06:58 阅读次数: 3

输入图片说明

1.Client调用DistributedFileSystem对象的create方法，创建一个文件输出流（FSDataOutputStream）对象。

2.通过DistributedFileSystem对象与Hadoop集群的NameNode进行一次RPC远程调用，在HDFS的Namespace中创建一个文件条目（Entry），该条目没有任何的Block。

3.通过FSDataOutputStream对象，向DataNode写入数据，数据首先被写入FSDataOutputStream对象内部的Buffer中，然后数据被分割成一个个Packet数据包。

4.以Packet最小单位，基于Socket连接发送到按特定算法选择的HDFS集群中一组DataNode（正常是3个，可能大于等于1）中的一个节点上，在这组DataNode组成的Pipeline上依次传输Packet。

5.这组DataNode组成的Pipeline反方向上，发送ack，最终由Pipeline中第一个DataNode节点将Pipeline ack发送给Client。

6.完成向文件写入数据，Client在文件输出流（FSDataOutputStream）对象上调用close方法，关闭流。

7.调用DistributedFileSystem对象的complete方法，通知NameNode文件写入成功。

猜你喜欢

转载自my.oschina.net/134596/blog/1641263

HDFS写入过程

HDFS数据的写入过程

Hadoop基础-HDFS的写入过程

Client向HDFS写入数据的过程解析

hadoop hdfs 文件写入/读取过程解析

日志写入hdfs过程中

大数据学习笔记——HDFS写入过程源码分析(2)

HDFS的数据写入流程是怎样的？请描述数据写入的过程。

flink写入hdfs

文件写入HDFS的流程

HDFS写入与读取流程

hdfs文件写入详情

剖析HDFS的文件写入

Hdfs的写入机制

HDFS写入数据

hdfs写入流程

HDFS写入数据的流程

HDFS写入过程客户端奔溃怎么处理？（租约恢复）

HDFS-文件写入API

HDFS写入和读取流程

HDFS写入流程详解

HDFS写入文件的重要概念

浅谈HDFS的文件读取与写入

HDFS(四)：文件写入解析

spark代码写入hdfs错误

Spark读取Es写入Hdfs

HDFS数据写入流程

读取HDFS数据写入MySQL

flink以gz格式写入hdfs

HDFS的文件写入过程.mapReduce编程模型.关于YARN的运行流程.shuffle阶段.Hive 中包含哪些数据模型

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)