MR，Spark提交任务的方式 - 代码天地

MR，Spark提交任务的方式

其他 2019-04-25 01:51:35 阅读次数: 0

MR提交：
1.本地运行模式
（1）mapreduce 程序是被提交给 LocalJobRunner 在本地以单进程的形式运行
（2）而处理的数据及输出结果可以在本地文件系统，也可以在 hdfs 上
（3）怎样实现本地运行？写一个程序，不要带集群的配置文件
本质是程序的 conf 中是否有 mapreduce.framework.name=local 以及
yarn.resourcemanager.hostname 参数
（4）本地模式非常便于进行业务逻辑的 debug，只要在 eclipse 中打断点即可

2.集群运行模式
（1）将 mapreduce 程序提交给 yarn 集群，分发到很多的节点上并发执行
（2）处理的数据和输出结果应该位于 hdfs 文件系统
（3）提交集群的实现步骤：
将程序打成 JAR 包，然后在集群的任意一个节点上用 hadoop 命令启动
hadoop jar wordcount.jar cn.itcast.bigdata.mrsimple.WordCountDriver args

Spark提交：
1.本地运行模式
（1）配置时加[local4]

2.集群运行模式

./bin/spark-submit \
  --class <main-class> \
  --master <master-url> \
  --deploy-mode <deploy-mode> \
  --conf <key>=<value> \
  ... # other options
  <application-jar> \
  [application-arguments]

参数定义如下：
–class: 应用程序的入口类
–master: 资源管理器master的URL，例如spark standalone资源管理器地址： spark://23.195.26.187:7077， yarn集群地址：yarn，本地调试模式地址：local
–deploy-mode: 部署模式，如果driver要部署到集群的worker节点，则设置为cluster，如果driver部署在本地开发机，则使用client，默认值为client
–conf: Spark环境相关的一些配置
application-jar: 应用程序的jar包
application-arguments: 入口类的输入参数

实例：
./spark2-submit
–class cn.test.spark.SparkStreamingKafkaDirect
–master yarn
–executor-memory 1g
–total-executor-cores 2
/home/ztx/spark_test_jar/spark_test.jar

猜你喜欢

转载自blog.csdn.net/weixin_43840194/article/details/86583007

MR，Spark提交任务的方式

Spark-submit方式提交spark任务

Spark任务提交方式和执行流程

Spark之Spark任务的提交方式【Spark-shell、Spark-submit】

Spark中yarn模式两种提交任务方式

Spark基于Yarn提交任务两种方式

.Spark基于Standalone提交任务两种方式

spark 提交任务命令

spark submit 提交任务

提交任务到Spark

spark任务提交

spark提交任务事例

Spark作业提交的方式

MR任务之后提交Hadoop批量索引任务

【Spark篇】---Spark中yarn模式两种提交任务方式

Spark从入门到精通二----spark任务的提交方式spark-shell/spark-submit----------各种版本的wordcount

spark 提交任务到集群

spark集群提交任务过程

Spark提交任务参数详解

Spark学习（二）--任务提交

Spark源码值提交任务

向Spark集群提交任务

Spark源码之提交任务

Spark任务提交源码解析

Spark 集群任务提交模式

Spark任务提交流程

Spark submit 提交任务（四）

Spark任务提交执行（二）

Spark任务提交执行（一）

Spark on Yarn提交任务过程

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)