hadoop基础学习总结(持续更新)

一.绪论

1.

(1)hadoop主要由HDFS和MapReduce组成HDFS是一个可以存储极大数据集的文件系统,它是通过向外扩展方式构建的主机集群。它有着独特的设计和性能特点,特别是,HDFS以时延为代价对吞吐量进行优化,并且通过副本替换冗余达到高可靠性。MapReduce是一个数据处理范式,它规范了数据在两个处理阶段(map和reduce阶段)的输入输出,并将其应用于任意规模的大数据集。

猜你喜欢

转载自blog.csdn.net/Ffffatass/article/details/79415876