HDFS优点:
一,高容错性1,数据自动保存多个副本
2,副本丢失后,自动恢复
二,适合批处理
1,移动计算而非数据
2,数据位置暴露给计算框架
三,适合大数据处理
1,GB,TB,甚至PB级数据
2,百万规模以上的文件数量
3,10K+节点
四,可构建在廉价机器上
1,通过多副本提高可靠性
2,提供了容错和恢复机制
HDFS缺点:
一,低延迟数据访问1,比如毫秒级
2,低延迟与高吞吐率
二,小文件存取
1,占用NameNode大量内存
2,寻道时间超过读取时间
三,并发写入,文件随机修改
1,一个文件只能有一个写者
2,仅支持append