Spark学习笔记2 网站日志流量分析系统 使用Docker搭建Spark集群(用于实现网站流量实时分析模块)

  本次学习还是为了实现之前搁置了很久的项目:网站日志流量分析系统,之前使用Docker搭建了基础环境:使用Docker搭建Spark集群(用于实现网站流量实时分析模块),这次再补补Spark的理论基础,再编写Scala代码实现网站流量实时分析

1、Spark架构

  

 ①Driver Program:用户编写的Spark程序称为Driver Program,每个Driver程序包含了

猜你喜欢

转载自www.cnblogs.com/rmxd/p/12194503.html