两本关于Hadoop的书

昨天刚从同事那拿到两本关于hadoop的书。

一本是hadoop的committer Tom White的大作《hadoop_The_definitive_guide》,大致看了下前言和目录,非常

详细的介绍了hadoop的各个方面。

另一本《Data-Intensive Text Processing with MapReduce》貌似还没有正式出版,介绍了如何用MapReduce设计一

些算法的技巧,包括常见的连接多个表,Inverted Indexing的实现,包括宽度优先、PageRank等图相关算法,以及

EM、HMM等机器学习算法是现实,总之感觉是本非常棒且实用。

不敢独享,拿出来与大家share.

猜你喜欢

转载自run-xiao.iteye.com/blog/675569