浅显地理解Hadoop和Hive

Hadoop实现了分布式文件系统,DFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。

Hive的出现使得不再需要复杂的编程去实现map和reduce,只要会用SQL(HQL),就可以通过简单的语句操作文件系统中的数据。hive是依赖Hadoop而存在的。

猜你喜欢

转载自blog.csdn.net/why444216978/article/details/83273324