Cloudera出品的各种官方文档 入门必备 https://www.cloudera.com/documentation.html
Cloudera Hadoop大数据平台实战指南 入门科普系列
Spark in Action 入门必备(虽然Impala很强大了,但是Impala主打MPP架构的SQL,很多情况下我们仍然需要编程式实现,所以掌握Spark是必须的)
spark官方文档 http://spark.apache.org/docs/latest/
开源大数据分析引擎Impala实战(权当做参考手册了,基本上可以认为就是翻译版)
hadoop权威指南 掌握必备
Hadoop技术内幕深入解析YARN架构设计与实现原理 进阶推荐
Hadoop核心技术 进阶推荐