MapReduce学习要点

1、mapreduce核心编程思想
2、mapreduce的三类实例进程(MrAppMaster、MapTask、ReduceTask)
3、wordcount官方案例
4、MapReduce编程规范(三个部分mapper、reducer、dirver)
5、本地测试、集群测试
6、Hadoop序列化概述
7、自定义bean对象实现序列化接口(writable)
8、InputFormat数据输入
9、数据切片与MapTask并行度决定机制
10、job提交流程及切片源码
11、FileInputFormat切片机制
12、FileInputFormat切片大小的参数配置
13、CombineTextInputFormat切片机制
14、 FileInputFormat实现类
15、KeyValueTextInputFormat使用案例
16、NLineInputFormat使用案例
17、自定义InputFormat
18、MapReduce工作流程
19、Shuffle机制
20、Partition分区
21、WritableComparable排序
22、自定义排序WritableComparable
23、Combiner合并
24、GroupingComparator分组(辅助排序)
25、MapTask工作机制
26、ReduceTask工作机制
27、OutputFormat数据输出
28、自定义OutputFormat
29、Reduce Join(工作原理)
30、Map Join
31、计数器应用
32、数据清洗(ETL)
33、Hadoop数据压缩
34、MR支持的压缩编码
35、压缩方式选择
36、压缩位置选择
37、压缩参数配置
38、Map输出端采用压缩
39、Reduce输出端采用压缩

猜你喜欢

转载自blog.csdn.net/weixin_46457946/article/details/114044350