Java大数据之路--HDFS详解（1）--概述

业界资讯 2023-07-19 04:41:41 阅读次数: 0

HDFS(分布式文件存储系统)--概述

目录

HDFS(分布式文件存储系统)--概述

一、概述

全称为Hadoop Distributed File System ，Hadoop分布式文件存储系统
HDFS是根据谷歌的论文：《The Google File System》进行设计的
本身是一个分布式的，可扩展，可靠的文件系统
HDFS中包含三个主要的进程：NameNode，DataNode，SecondaryNameNode。这三个进程一般是分布式不同的主机上，所以一般习惯上是用进程的名字称呼节点

二、特点

优点：

支持超大文件。超大文件在这里指的是几百M，几百GB，甚至几TB大小的文件。一般来说Hadoop的文件系统会存储TB级别或者PB级别的数据。所以在企业的应用中，数据节点有可能有上千个
检测和快速应对硬件故障。在集群的环境中，硬件故障是常见的问题。因为有上千台服务器连接在一起，这样会导致高故障率。因此故障检测和自动恢复(心跳机制)是HDFS文件系统的一个设计目标
流式数据访问。HDFS的数据处理规模比较大，应用一次需要访问大量的数据，同时这些应用一般都是批量处理，而不是用户交互式处理。应用程序能以流的形式访问数据集。主要的是数据的吞吐量，而不是访问速度
简化的一致性模型。大部分hdfs操作文件时，需要一次写入，多次读取。在HDFS中，一个文件一旦经过创建、写入、关闭后，一般就不需要修改了。这样简单的一致性模型，有利于提高吞吐量
高容错性。数据自动保存多个副本，副本丢失后自动恢复
可构建在廉价机器上。构建在廉价机器上可以轻松的通过扩展机器数量来近乎线性的提高集群存储能力

缺点：

不能低延迟数据访问。如和用户进行交互的应用，需要数据在毫秒或秒的范围内得到响应。由于Hadoop针对海量数据的吞吐量做了优化，牺牲了获取数据的延迟，所以对于低延迟来说，不适合用hadoop来做
不适合存储大量的小文件。HDFS支持超大的文件，是通过数据分布在数据节点，数据的元数据保存在名字节点上。名字节点的内存大小，决定了HDFS文件系统可保存的文件数量。虽然现在的系统内存都比较大，但大量的小文件还是会影响名字节点的性能
不支持多用户写入、修改文件。HDFS的文件只能有一次写入，不支持修改和追加写入（2.0版本支持追加），也不支持修改。只有这样数据的吞吐量才能大
不支持超强的事务。没有像关系型数据库那样，对事务有强有力的支持，不会因为一个块的丢失影响全部数据，因为数据量太大。

猜你喜欢

转载自blog.csdn.net/a34651714/article/details/102812441

Java大数据之路--HDFS详解（1）--概述

Java大数据之路--HDFS详解（3）--基本命令

Java大数据之路--HDFS详解（2）--技术细节

大数据技术之Hadoop之HDFS(1)——HDFS概述

Java大数据之路--HDFS详解（4）--回收站机制及dfs目录

Java大数据之路--HDFS详解（5）--执行流程及API操作

Java大数据开发之HDFS详解

大数据学习之路-hdfs

大数据学习之路--HDFS

Java大数据之路--Hadoop(1)

Java大数据之路--MapReduce(1)

大数据概述1

大数据-Hadoop生态(5)-HDFS概述

大数据Hadoop之HDFS概述

大数据之路_1

大数据（1）---大数据及HDFS简述

大数据学习1——大数据概述

大数据1_大数据概述

大数据笔记 1--hadoop中的hdfs写数据流程详解

大数据求索(1)：HDFS安装指南

大数据小白系列——HDFS(1)

大数据基础之hdfs1

大数据平台——HDFS的Shell操作 (1)

大数据之路week07--day01（HDFS学习，Java代码操作HDFS，将HDFS文件内容存入到Mysql）

小鑫的JAVA之路(1):JAVA概述

大数据学习之路（二）HDFS1.0

大数据学习之路------HDFS开发环境搭建与API

大数据学习之路1-hdfs集群安装-参数配置-namenode格式化--手动启动

大数据学习06：Java访问HDFS

Java大数据开发：Hadoop-HDFS

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)