Spark 源码阅读学习（一） - 代码天地

Spark 源码阅读学习（一）

其他 2018-12-31 11:31:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Koprvhdix/article/details/81209555

写本文的目标就是立下 flag ：好好研读 Spark 源码，从 branch-0.7 这个分支开始。

如何通过阅读源码提高自己

大家都说要多读优秀开源框架的源码，那么怎么读呢？像 Apache Spark 在 GitHub 上有两万多个 commit，将源码导入 IDEA 之后好多好多源码文件，看着很绝望。
后来我去看知乎上的如何去阅读并学习一些优秀的开源框架的源码？，很多优秀的回答核心思想都是说要看开源框架早期的代码。其中有个回答是这样说的：从第一个commit读起来，而不是最后一个。 真的是一语中的。

选择 Spark 的早期版本进行阅读

自从学习了从项目早期代码读起来后，我下意识以为越早期的越好，就去 GitHub 上看分支号。最早期的分支是 branch-0.5，也就是版本号为 0.5 的代码；然后就下载下来看了一下。嗯，我不是通过切分支看的，而是通过下载zip包。只有 800 多个 commit ，代码好少，真应了那句：“伟大的项目不是一开始就很伟大，而是越来越伟大”。但是有个非常大的问题，0.5 版本的代码没有 maven 管理依赖，同时代码之间的依赖也不能方便跳转（也有可能是在下的打开姿势不对）。
然后为了找个更加方便阅读的，就去查了一下哪个版本开始有 maven 管理依赖，是 0.7 开始。于是从现在开始认真研读 0.7 的代码。（flag 已立）

Spark 的第一个 commit

既然有人说要从第一个 commit 开始读起来，那 Spark 的第一个 commit 是什么呢？同时怎么才能从 GitHub 上翻到第一个 commit。
在SF上有个提问：如何快速查看github上的第一次commit。然后我就根据指点成功翻到了 Spark 的第一个 commit。

https://github.com/apache/spark/commit/df29d0ea4c8b7137fdd1844219c7d489e3b0d9c9

结束语

这是一个开始！

猜你喜欢

转载自blog.csdn.net/Koprvhdix/article/details/81209555

Spark 源码阅读学习（一）

Spark 源码阅读(一)

Spark 源码阅读分析（一）

spark源码阅读（一）启动代码阅读

Spark客户端源码阅读（一）

spark源码阅读---SparkConf

spark源码阅读

spark学习之路----配置spark编译源码，准备阅读环境

spark源码阅读笔记Spark原理（一）基本前提

spark--Spark源码阅读思路

Spark源码学习之IDEA源码阅读环境搭建

Spark源码阅读环境搭建

spark源码阅读笔记RDD（一）RDD的基本概念

spark 启动消息通信基本过程源码阅读(一)

Spark学习——初识spark

Spark学习---Spark概述

Spark（一）Spark概述

【Spark】(一) Spark入门

spark源码学习-withScope

[Spark]Spark入门资料阅读

Spark源代码阅读（一）

spark源码《一》RDD

spark源码

Spark.2.2源码阅读: SPARK SUBMIT任务提交

spark源码阅读(spark-submit提交脚本分析)

图解Spark源码（一）--- Spark 通信架构

Spark源码阅读——任务提交过程

Windows下搭建spark源码阅读环境

spark.mllib源码阅读-bagging方法

Crail-spark-io源码阅读

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)