编译spark2.1.0

其他 2018-10-14 11:12:47 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/eieiei438/article/details/82193405

编译spark2.1.0

目标

得到spark-2.1.0-bin-2.6.0-cdh5.7.0

环境

jdk
- 1.8.0_65【1.7+】
maven
- Apache Maven 3.3.9【3.3.9版】
spark
- 2.1.0
- 下载地址【http://spark.apache.org/downloads.html】
- 选项选择

settings.xml文件

。。。
<mirrors>
    <mirror>
            <id>nexus</id>
            <mirrorOf>*,!cloudera</mirrorOf>
            <url>http://repo1.maven.org/maven2/</url>
    </mirror>
</mirrors>
。。。

pom.xml文件

。。。
<repository>
    <id>cloudera</id>
    <name>cloudera repository</name>
    <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
</repository> 
。。。

环境变量/etc/profile中添加【编译机器内存可能不够】

export MAVEN_OPTS="-Xmx2g -XX:ReservedCodeCacheSize=512m"

执行

解压spark-2.1.0
- tar -vxf spark-2.1.0.tgz
执行脚本change-scala-version.sh 2.10【Scala版本是2.10 需要先执行如下的脚本】
- sh spark-2.1.0/dev/change-scala-version.sh 2.10
执行编译命令
- sh spark-2.1.0/dev/make-distribution.sh --name 2.6.0-cdh5.7.0 --tgz -Pyarn -Phadoop-2.6 -Phive -Phive-thriftserver -Dhadoop.version=2.6.0-cdh5.7.0
等待编译完成【过程比较漫长】

编译过程可能非常长，遇到最后一个错误

错误提示

解决方案

在spark下的pom.xml文件中添加依赖

<dependency>
    <groupId>net.alchim31.maven</groupId>
    <artifactId>scala-maven-plugin</artifactId>
    <version>3.2.2</version>
</dependency>

猜你喜欢

转载自blog.csdn.net/eieiei438/article/details/82193405

编译spark2.1.0

spark2.1.0安装步骤

spark2.1.0编译 cdh5.7.0版本

Spark2.1.0——Spark初体验

Spark2.1.0——剖析spark-shell

Spark2.1.0之初识Spark

Spark2.1.0——Spark环境更新

Spark2.1.0入门：DStream转换操作

spark2.1.0之配置与源码分析

Spark2.1.0之内置RPC框架

Spark2.1.0之模块设计

Spark2.1.0之基础知识

Spark2.1.0之运行环境准备

Spark2.1.0之初体验

spark2.1.0发布了

Spark2.1.0——WebUI框架体系

Spark2.1.0之剖析spark-shell

Spark2.1.0之代码结构及载入Ecplise方法

Spark2.1.0分布式集群安装

spark2.1.0之源码分析——RPC配置TransportConf

Spark2.1.0之模型设计与基本架构

spark2.1.0集群环境搭建

Java Spark2.1.0 读取文本写入MySQL

Spark2.1.0之源码分析——事件总线

Spark2.1.0模型设计与基本架构（下）

spark2.1.0 on yarn with CDH5.8.0 安装实战

Spark2.1.0——Executor动态分配的实现原理

Spark2.1.0事件总线分析——LiveListenerBus详解

Spark2.1.0事件总线分析——ListenerBus的继承体系

Spark2.1.0文档：Spark Streaming 编程指南（上）

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)