大数据、云计算系统高级架构师学习路线图

大数据之Linux+大数据开发篇

Java Linux基础 Shell编程 Hadoop2.x HDFS YARN MapReduce ETL数据清洗Hive Sqoop Flume/Oozieo 大数据WEB工具Hue HBase Storm Storm ScalaSpark Spark核心源码剖析 CM 5.3.x管理 CDH 5.3.x集群

项目部分

用户行为分析 项目二:驴妈妈离线电商平台分析平台 项目三:基于Spark技术实现的大型离线电商数据分析平台

大数据之阿里云企业级认证篇

阿里云数据处理和分析 报表场景的实现(企业案例) 企业自助沙箱实验(10个) 阿里云企业认证(ACP11003模块)

大数据之Java企业级核心技术篇

Java性能调优 Tomcat、Apache集群 数据库集群技术 分布式技术 WebLogic企业级技术

大数据之PB级别网站性能优化篇

CDN镜像技术 虚拟化云计算 共享存储 海量数据 队列缓存 Memcached+Redis\No-SqlLVS负载均 Nginx

项目部分

PB级通用电商网站性能优化解决方案

大数据之数据挖掘\分析&机器学习篇

Lucene 爬虫技术 Solr集群 KI分词 Apriori算法 Tanagra工具 决策树 贝叶斯分类器人工神经网络 K均值算法 层次聚类 聚类算法 SPSS Modeler R语言 数据分析模型统计算法 回归 聚类 数据降维 关联规则 决策树 Mahout->Python金融分析

项目部分

项目一:地震预警分析系统 项目二:文本挖掘(Mathout\中文分词) 项目三:电商购物车功能实现(R语言)项目四:使用Python构建期权分析系统

大数据之运维、云计算平台篇

Zookeeper Docker OpenStack云计算

项目部分

项目部分:Maven+Jenkins、日志管理ELK、WordPress博客


猜你喜欢

转载自blog.51cto.com/13924610/2160412