编译spark2.4.2-bin-2.6.0-cdh5.7.6 - 代码天地

编译spark2.4.2-bin-2.6.0-cdh5.7.6

其他 2019-07-05 14:41:06 阅读次数: 0

记录自己编译spark的过程

一、环境

1.hadoop环境为：Hadoop 2.6.0-cdh5.7.6
2.Scala环境为：Scala code runner version 2.11.12
3.jdk环境为：1.8
4.maven环境为：Apache Maven 3.6.1
5.spark版本为：spark-2.4.2.tgz

二、配置maven

在maven的conf目录下的settings.xml添加

##配置mvn的本地存放位置
<localRepository>/usr/local/maven/repo</localRepository>

##配置mvn下载源为阿里云的maven仓库，加速下载
<mirror>
<id>alimaven</id>
<name>aliyun maven</name>
<url>http://maven.aliyun.com/nexus/content/groups/public/</url>
<mirrorOf>central</mirrorOf>

三、配置spark

	1.#修改pom.xml文件，添加clouder仓库
	<repository>
 		<id>cloudera</id>
  		<url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
	</repository>
    2.到dev目录下 make-distribution.sh修改版本

如图：

四、执行编译命令

	到spark的dev目录下执行下面的命令
	./make-distribution.sh --name 2.6.0-cdh5.7.6 --tgz -Pyarn -Phadoop-2.6 -Phive -Phive-thriftserver -Dhadoop.version=2.6.0-cdh5.7.6
	参数解释：
	 --name：生成压缩包的后缀名字；前缀默认为spark版本的名字，本例为：spark-2.4.2-bin
	  --tgz：采用压缩格式为tar，压缩的后缀名为.tgz
	  -Pyarn：表示spark需要运行在yarn上面
	  -Phadoop-2.6：表示spark使用hadoop的profile的id
	  -Dhadoop.version=2.6.0-cdh5.7.7：表示spark使用hadoop的版本；如果不指定，默认使用的是2.2.0的hadoop
	  -Phive -Phive-thriftserver：表示支持hive

五、编译完成

	编译时间上不封顶，全看网速，我的就比较悲催，中间网速太慢。失败了好几次，最终如下图：

在这里插入图片描述
最后看到编译完成后的它。静静躺在那里：

终于编译完成了，可以开始学习spark了
加油

猜你喜欢

转载自blog.csdn.net/weixin_37761111/article/details/92383553

编译spark2.4.2-bin-2.6.0-cdh5.7.6

spark2.4.2-cdh5.7.0源码编译

spark-2.2.0-bin-2.6.0-cdh5.12.1.tgz 编译方法总结！

Spark编译hadoop-2.6.0-cdh2.7.0

spark编译安装 spark 2.1.0 hadoop2.6.0-cdh5.7.0

Spark 2.3.2源码编译，支持hadoop-2.6.0-cdh5.15.0

源码编译Spark，Hadoop 2.6.0-cdh5.7.0 版本

Spark2.4.2源码编译

spark2.4 整合 hadoop2.6.0-cdh5.7.0 源码编译

Spark2.4.0源码编译支持hadoop-2.6.0-cdh5.7.0

Hadoop2.6.0.CDH 源码编译

hadoop-2.6.0-cdh5.16.2编译

spark-2.4.2.tgz下载及编译

CDH版hadoop2.6.0-cdh5.7.0源码编译

spark的cdh版本编译

cdh 5.12.1 集成kylin (apache-kylin-2.6.0-bin-cdh57)记录

hadoop-2.6.0-cdh5.12.1源码编译支持Snappy

Hadoop2.6.0-cdh5.4.1源码编译安装

使用阿里云主机编译 hadoop-2.6.0-cdh5.15.1

编译hadoop2.6.0-cdh5.7.0 native支持snappy & 编译中遇到的坑及解决办法

30-10-010-编译-kylin-on-druid-2.6.0-CDH57编译

spark2.2.0-hadoop2.6.0预编译集群安装

Linux平台spark-cdh源码编译

Spark项目之环境搭建（单机）四 sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz 安装

编译Hadoop2.6.0-cdh-5.7.0源码支持五种压缩方式

hadoop-2.6.0-cdh5.7.0 编译，支持 native 和压缩详细操作

FLINK1.9.1源码编译支持hadoop2.6.0-cdh1.15.1

在mac上Flink1.9.0源码编译（使用yhadoop2.6.0-cdh5.15.1）

Spark2.4.2报错总结

hadoop之hadoop-2.6.0-cdh5.7.0源码编译支持压缩以及伪分布式部署

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)