Hadoop初体验(一)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ruizhenggang/article/details/78659956

大数据:数据集的大小超过了现有典型的数据库软件和工具处理的能力。于此同时,为了满足数据的捕捉、存储、聚合、管理这些大数据以及对数据的深度分析的技术,诞生出来一些处理大数据的架构。Hadoop就是一个典型而又很好的产物。他是Apache基金会所开发的分布式系统基础架构。(免费!!)


Hadoop 产生:为了解决Nutch的海量数据抓取和存储的需要。


Hadoop的核心分为:HDFS、MapReduce。


对比——

单台关系型数据库---优:多存储,扩展了容量和计算能力;

缺:计算、存储分离,存在竞争和带宽的瓶颈;支持数据有限,扩展性低。

Hadoop集群--- 优:计算与存储融合,更好的扩展性;

缺:数据冲突,需要节点协作。




猜你喜欢

转载自blog.csdn.net/ruizhenggang/article/details/78659956