Hadoop能做什么

最近开始漫无目的的研究Hadoop,在总结一下它能做什么之前,想到一句业内的名言:
“如果你不能打败你的对手,那就把他的技术开源吧。”

Hadoop的核心是一个分布式计算和存储平台,从其核心的HDFS和Map/Reduce来说,它可以做下面的事情:
1.日志分析:这是当前用的最多的一个用途,百度就是用Hadoop实现的其日志分析功能。
2.海量数据的查询:从海量数据中找出你需要的那个。
3.数据分析:提供强大的计算功能支持大量的计算分析。

其实,Hadoop能做什么,一是存储,二是计算。

关键是看你想让Hadoop做什么,Hadoop适合什么样的计算,什么样的存储。

HDFS是一个分布式的文件系统,适合的是非结构化数据的存储。
Map/Reduce是一个并行编程模型,适合高并发、高读写的计算。

猜你喜欢

转载自zixufei201204150421.iteye.com/blog/1567428