一.绪论
1.
(1)hadoop主要由HDFS和MapReduce组成。HDFS是一个可以存储极大数据集的文件系统,它是通过向外扩展方式构建的主机集群。它有着独特的设计和性能特点,特别是,HDFS以时延为代价对吞吐量进行优化,并且通过副本替换冗余达到高可靠性。MapReduce是一个数据处理范式,它规范了数据在两个处理阶段(map和reduce阶段)的输入输出,并将其应用于任意规模的大数据集。
一.绪论
1.
(1)hadoop主要由HDFS和MapReduce组成。HDFS是一个可以存储极大数据集的文件系统,它是通过向外扩展方式构建的主机集群。它有着独特的设计和性能特点,特别是,HDFS以时延为代价对吞吐量进行优化,并且通过副本替换冗余达到高可靠性。MapReduce是一个数据处理范式,它规范了数据在两个处理阶段(map和reduce阶段)的输入输出,并将其应用于任意规模的大数据集。