linux脚本启动spark-shell并执行scala文件 - 代码天地

linux脚本启动spark-shell并执行scala文件

其他 2018-09-23 21:25:12 阅读次数: 0

要学习程序员思维，step by step

1.如果自己平台安装了scala，好办，在shell脚本直接

scala filename.scala args args

2.如果没装scala

1）检查自己hadoop平台安装的spark环境，cd到路径

2）执行./bin/spark-shell是否启动scala

3）在脚本中执行 ./bin/spark-shell -i <filename.scala 是否可以运行（这里可以使用export临时环境变量）

4）如果你要传参，好的，在执行文件前加入

set +o posix 这是为了防止下一句输入<()报错：(语法错误。Ps注意，<和左括号中间没有空格

@1 ./bin/spark-shell -i <(echo 'val = args;args';filename.scala) 这个我试过了，不行，没查出来是什么情况（可以在自己scala代码前述加入 val args = "'$arguments'".split("\\s+") 后面将main函数传入的参数封装起来）

@2 ./bin/spark-shell -i <filename.scala --conf spark.driver.args=("arg1 arg2")

filename.scala中添加

val args = sc.getConf.get("spark.driver.args").split("\\s+")

args:Array[string] = Array(arg1,arg2)

Objectname.main(args(1),args(2))

3.也可以构建项目，构建sbt文件来执行scala

这个部分随便一个scala教程都有，不做赘述

参考地址：

https://www.cnblogs.com/tugeler/p/5265331.html

https://stackoverflow.com/questions/29928999/passing-command-line-arguments-to-spark-shell

最后感谢大神！要学习程序员思维呀！

最新问题：由于文件体积很大，遇到OOM问题，spark内存溢出。需要设置内存参数

./bin/spark-shell -i --driver.memroy 20g <filename.scala --conf spark.driver.args=("arg1 arg2")

程序中加入

val conf = Set("spark.executor.memory", "20g")

猜你喜欢

转载自blog.csdn.net/yushu4772/article/details/81208177

linux脚本启动spark-shell并执行scala文件

执行spark-shell报错：

spark-shell启动错误

本地启动spark-shell

spark-shell启动报错

spark-shell启动spark报错

三、Spark-shell执行计算

启动spark-shell --master yarn的bug

CDH Spark-shell启动报错

spark-shell读取parquet文件

spark-shell的Scala的一些方法详解

Spark-Core之spark-shell脚本分析

spark程序提交执行，spark-shell，算子

spark-shell解析

spark-shell 参数

spark-shell

剖析Spark-Shell

CDH集群spark-shell执行过程分析

spark-shell启动报错解决办法

spark-shell 启动出现 error not found 报错问题

spark-shell 下文件系统的数据读写

spark-shell 高级操作

SparkContext和spark-shell

linux下shell脚本执行jar文件

大数据篇：Spark-shell的测试及Scala独立应用程序的编写与sbt打包

linux启动jar文件Shell脚本

Crontab执行java/spark-shell/spark-submit 异常解决方法

SPARK 启动spark-shell报错The specified datastore driver ("com.mysql.jdbc.Driver") was not found

【CDH6.1 spark-shell启动报错】Cluster deploy mode is not applicable to Spark shells

Spark2.1.0——剖析spark-shell

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)