1.HDFS是hadoop的分布式文件系统。
特性:(1)HADFS是基于java的一个分布式文件系统。
(2)基于unix/Linux的操作
(3)是hadoop的最重要的核心组件(可以理解为存储即基础)
(4)支持顺序写入,而非随机定位书写。
HDFS的设计前提以及设计目标:
(1)HDFS适合存储大的文件,单个文件存储达到百M以上。
(2)硬件容错,并且是基于普通机器搭建的,因此容错性比较高。
(3)错误监测,自动恢复,快速是HDFS一个重要的目标。
(4)为数据批处理而设计的,因此关注数据的高吞吐量。
(5)简单的一致性模型,一次写入,多次读取。
(6)一个文件经过创建写入关闭之后,就不需要改变
(7)使用本地进项计算。