Hadoop-HDFS基本概念介绍(设计思路，架构，优缺点) - 代码天地

Hadoop-HDFS基本概念介绍(设计思路，架构，优缺点)

其他 2019-02-28 21:12:19 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qichangjian/article/details/87939605

1. HDFS的设计思路？

HDFS：Hadoop Distributed File System Hadoop 分布式文件系统，主要用来解决海量数据的存储问题

在这里插入图片描述

1.大文件被切割成小文件，使用分而治之的思想让很多服务器对同一个文件进行联合管理
2.每个小文件做冗余备份，并且分散存到不同的服务器，做到高可靠不丢失

2.HDFS 架构

主节点 Namenode：
集群老大，掌管文件系统目录树，处理客户端读且请求

SecondaryNamenode：
严格说并不是 namenode 备份节点(冷备)，主要给 namenode 分担压力之用,元数据合并工作

从节点 Datanode：
存储整个集群所有数据块，处理真正数据读写

在这里插入图片描述

3. HDFS的优缺点？

优点：

可构建在廉价机器上，通过多副本提高可靠性，提供了容错和恢复机制
高容错性，数据自动保存多个副本，副本丢失后，自动恢复
适合批处理，移动计算而非数据，数据位置暴露给计算框架
适合大数据处理，GB、TB、甚至 PB 级数据
流式文件访问，一次性写入，多次读取，保证数据一致性

缺点：

低延迟数据访问，不适合于低延迟高吞吐
小文件存取，不适用与小文件存储，占用空间，寻道时间超过读取时间
不支持并发写入，和随机读取。hdfs同一时间只能有一个写入者，并且不支持多次插入，只能追加

4. HDFS的特性？

HDFS 中的文件在物理上是分块存储（block），块的大小可以通过配置参数(dfs.blocksize)来规定，默认大小在 hadoop2.x 版本中是 128M，老版本中是 64M
HDFS 文件系统会给客户端提供一个统一的抽象目录树，客户端通过路径来访问文件
namenode 是 HDFS 集群主节点，负责维护整个 hdfs 文件系统的目录树，以及每一个路径（文件）所对应的 block 块信息（block 的 id，及所在的 datanode 服务器）
datanode 是 HDFS 集群从节点，每一个 block 都可以在多个 datanode 上存储多个副本（副本数量也可以通过参数设置 dfs.replication，默认是 3）
HDFS 是设计成适应一次写入，多次读出的场景，且不支持文件的修改

猜你喜欢

转载自blog.csdn.net/qichangjian/article/details/87939605

Hadoop-HDFS基本概念介绍(设计思路，架构，优缺点)

HDFS的基本概念介绍

Hadoop-HDFS-概述介绍（背景及定义、优缺点、组成架构、Block介绍）-连载中

Hadoop 之 HDFS基本概念

Hadoop之HDFS基本概念

【Hadoop】一、HDFS简介及基本概念

Hadoop_HDFS（一）：基本概念

Hadoop HDFS 概述 | 优缺点 | 组成架构 | 文件块大小

Hadoop中HDFS优缺点

Hadoop-HDFS的简单架构原理

1.0 Hadoop-HDFS介绍及安装

HDFS基本概念与重新梳理（hdfs文件信息介绍）

HDFS的基本概念

HDFS基本概念

[ ceph ] 基本概念、原理、架构介绍

Hadoop之HDFS(一)基本概念及操作

Hadoop-hdfs

Hadoop-HDFS部署

初识Hadoop-HDFS

Hadoop-HDFS命令

hadoop-hdfs框架

Hadoop-HDFS概述

Hadoop-HDFS详解

Hadoop-HDFS学习

Hadoop-hdfs操作

Hadoop基本概念

HDFS的原理与基本概念

HDFS简介及基本概念

【Hadoop学习之HDFS】_04HDFS的优缺点

WLAN—基本概念介绍&基本拓扑架构

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)