之前一直忙着换工作的事,才发现已经一个月没写东西了。
入职新公司,开始做数据方面的工作。看了一下公司wiki,感觉要学的东西还挺多。
从之前的经验来看,看书比从网上搜博客看来的靠谱。一方面是质量有保证,很少有错误,另一方面是会学的比较系统。
于是从网上搜了一下书单,感觉挺乱的。知乎上推荐的大多是paper,以及英文原版书籍,看起来会比较麻烦;豆瓣上好像还行,但是不能按照评分排序,比较蛋疼。最后加上京东评分,综合参考,选了以下几本书。
hadoop:Hadoop权威指南:大数据的存储与分析(第4版)
spark:Spark快速大数据分析
kafka:Kafka权威指南