关于Hadoop分布式系统---HDFS

Hadoop之HDFS

Hadoop分布式文件系统-HDFS结构
HDFS采用master/slave结构

HDFS组成角色及其功能
client:客户端–>负责读取与存储
NameNode:元数据节点–>存储元数据,放入内存里,操作比较快。
管理文件系统的Namespace元数据(管理一个目录树)
一个HDFS集群只有一个Active的NN
DateNode:数据节点–>存储数据
数据存储节点,保存和检索block
一个集群可以有多个数据节点
Secondary NameNode:从元数据节点(如果NameNode结束则Secondary NameNode不能正常运行)
合并NameNode的edit logs到fsimage文件中
辅助NN将内存中元数据信息持久化

HDFS副本机制(备份)----->将一个大文件分成多个数据块,防止荡机造成整个系统的崩溃
Block:数据块
HDFS最基本的存储单元
默认块大小:128 M(2.x)
副本机制
作用:避免数据丢失
副本数默认为3,可以自己调整
存放机制:
一个在本地机架节点
一个在同一个机架不同节点
一个在不同机架的节点

HDFS优缺点
HDFS优点:
高容错性
适合大数据处理
流式数据访问
可构架在廉价的机器上
HDFS缺点:
不适合低延时数据访问场景
不适合小文件存取场景
不适合并发写入,文件随机修改场景(同一时间只能一个用户来写)

猜你喜欢

转载自blog.csdn.net/weixin_42507474/article/details/107033170
今日推荐