Spark(29)-Spark Shell及编写Spark独立应用程序 - 代码天地

Spark(29)-Spark Shell及编写Spark独立应用程序

其他 2023-07-11 18:19:49 阅读次数: 0

任务提交

一个线程启动一个任务

物理CPU包含多个逻辑CPU

local是本地的单机模式

集群模式就是下面的，

集群模式有三种：Standalone,Yarn,Mesos

yarn-client与yarn-cluster的区别就是driver所在地不一样。

本地模式启动参数

实例

如上代码：

导包，单例对象，入口函数main,

需要我们人为创建一个SparkContext，作为链接集群的入口，new 一个SparkContext sc需要一个配置参数conf

注：我们在spark-shell中启动时，自动创建一个sc,我们可以直接拿来用

然后我们启动两个线程作为两个分片

随后过滤，我们的.filter后面跟的是一个lambda表达式，以line作为输入参数，=>右边执行的是把line中包含a的筛选出来，最后统计一下。

这里我们基本用的核心包spark-core.

如果第一次使用sbt,那么会耗费很长时间，后面再使用时就会很快了。

target目录是保存jar包的位置

spark-submit

object后面的就是主类

~表示用户主目录

WordCount词频统计-在spark-shell中

读本地文件三个斜杆

对textFile-RDD的操作，把一行单词用空格区分，牌匾掉

再把单词映射为键值对，map中就是一堆键值对

.reduceByKey（），对有相同键进行求和汇总

例如hadoop,1 hadoop,2 =》 hadoop,3

在集群中，我们想在driver所在的节点把其他节点统计结果汇总，那就用.collect(）

写一个单独的程序编译打包

为什么setAppName呢，会在Spark-UI访问监控界面，有助于监测当前程序运行状态。

注意：下面代码的textFile与sc.textFile是两个不同，sc.textFile是一个方法，生成的textFile是一个RDD

在集群上运行Spark应用程序

在集群中运行应用程序JAR包

在集群中运行spark-shell

查看Spark-UI界面，查看8080端口

猜你喜欢

转载自blog.csdn.net/qq_52128187/article/details/131113143

Spark(29)-Spark Shell及编写Spark独立应用程序

在spark-shell中运行代码编写Spark独立应用程序在集群上运行Spark应用程序

大数据篇：Spark-shell的测试及Scala独立应用程序的编写与sbt打包

29_spark七—hive

spark

spark：

【spark】

提交Spark应用程序

spark应用程序的执行

详解Java编写并运行spark应用程序的方法

29.Spark SQL发展史

Spark之集群模式运行Spark应用程序

Spark提交应用程序之Spark-Submit分析

Spark之——Spark Submit提交应用程序

[Spark] 使用IDEA构建Spark应用程序实例

[Spark] 使用IDEA构建Spark应用程序

spark-submit spark应用程序提交和运行

Spark之——Spark Submit提交应用程序详解

在Spark Shell中编写WordCount程序

spark应用程序开发总结

spark应用程序的运行架构

Spark应用程序的监控方式

Spark应用程序的执行过程

Spark应用程序之间调度

IDEA开发Spark应用程序

【总结】Spark应用程序的资源分配

Spark Streaming应用程序调优

Hadoop集群运行Spark应用程序

Spark 编写WordCount程序

idea编写spark程序

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)