大数据小白学习必备路线图

大数据环境比较复杂,并不像学习编程软件一样,机器安装一下,跟老师敲几行代码就可以了,大数据学习起来可要麻烦多了,至少要准备好虚拟化的集群环境,然后又要安装部署各种计算框架,所以需要有耐心,有一定解决问题的能力,坚持不懈,才有可能学好大数据。

千锋老师通过社会调研和企业走访,针对零基础小白制定了一套大数据的学习路线图,大家可以参考学习了!

第一阶段 Java语言基础阶段

1.1 Java编程语言基本概述

1.2 Java基础语法

1.3 面向对象编程

1.4 面向对象高级编程

1.5 Java中的常用类库

1.6 枚举和异常类

1.7 Java数据结构和集合框架泛型

1.8 Java中的IO流

1.9 Java中的多线程

1.10 Java中网络编程和反射

1.11 Java8新特性

1.12 Java基础加强

第二阶段 Linux系统&Hadoop生态体系

01 Linux入门

02 常用基本命令

03 系统管理

04 Linux操作增强

05 Linux shell编程

06 Hadoop生态

07 分布式系统概述

08 Hadoop入门

09 Hadoop伪分布式

10 Hadoop全分布式

11 HDFS基本概念

12 HDFS的应用开发

13 HDFS的IO流操作

14 NameNode工作机制

15 DataNode工作机制

16 Zookeeper入门

17 Zookeeper详解

18 HA框架原理

19 Hadoop-HA集群配置

20 MapReduce框架原理

21 Shuffle机制

22 Mapreduce案例一

23 Mapreduce案例二

24 Hive入门

25 Hive DDL数据定义

26 Hive分区表

27 Hive分桶表

28 Hive查询

29 Hive的高级查询Join与排序

30 Hive的函数

31 Hive DML数据管理

32 Hive文件存储

33 Hive企业级调优

34 Hive企业级调优二

35 Hive企业级项目实战

36 Flume详解

37 Sqoop详解

38 Hbase概念

39 Hbase的操作

40 Hbase整合

41 Hbase的实战和优化

第三阶段 分布式计算框架

3.1 scala

3.2 Spark Core

3.3 Spark SQL

3.4 Spark Streaming

3.5 kafka

3.6 ElasticSearch

3.7 Logstash

3.8 Kibana

3.9 Kibana

第四阶段 大数据实战项目

以北京的中关村、西二旗等IT密集的公司为技术背景。如:sina微博的DSP广告大数据分析平台、百度搜索引擎挖掘计算流量等。

标准的大数据团队流程:项目分析,业务分析,数据量分析,技术实现,数据表的设计,线下功能调试,性能调优,数据倾斜, Trouble Shooting等,掌握此流程,大数据P7级别。

第五阶段 大数据分析

5.1 Data Analyze数据分析基础

5.2 工作环境准备

5.3 数据可视化的概念与准则

5.4 Python机器学习

5.5 选择模型

5.6 构建树的过程

5.7 网格搜索

5.8 sklearn中有三类朴素贝叶斯算法

5.9 颜色特征

5.10 手写数字识别

5.11 文本的基本组成

5.12 文本的基本组成

以上就是详细版的大数据学习路线图,学习的小伙伴可以把它当做一个基础的框架,进行多维度学习!

猜你喜欢

转载自blog.csdn.net/GUDUzhongliang/article/details/85681813