Spark2.0 概念 - 代码天地

Spark2.0 概念

编程语言 2019-02-27 11:58:06 阅读次数: 0

 
  
  
   
  
 入口点：
 Spark2.0中所有的入口点都是SparkSession，只需要使用SparkSession.builder(),SparkConf、SparkContext和SQLContext都已经被封装在SparkSession当中。
执行单位：
 Spark集群的执行单位是Application，一个Application中可以有多个job,setMaster是连接主节点，如果参数是”local[*]”，则在本地用单线程运行spark，如果是 local[4]，则在本地用4核运行,而setAppName就是在web端显示应用名而已，它们说到底都调用了set()函数
运行模式：
 1.local --在IDEA中开发spark程序要用local模式，本地模式，多用于测试
 2.stanalone --spark自带的资源调度框架，spark任务可以依赖standalone调度资源
 3.yarn --hadoop生态圈中资源调度框架，spark也可以基于yarn调度资源
 4.mesos --资源调度框架
SparkConf：
 1.可以设置spark的运行模式
 2.可以设置spark在webui中显示的application的名称
 3.可以设置当前spark application 运行的资源（内存+core）
SparkContext：
 通往集群的唯一通道是通往集群的唯一通道，通过sc.textFile 读取文件
Spark 中 DataFrame的三种创建方式:
 方法一，Spark中使用toDF函数创建DataFrame,导入隐式转换就可以将本地序列(seq), 数组或者RDD转为DataFrame
 方法二，Spark中使用createDataFrame函数创建DataFrame,数据形态也可以是本地数组或者RDD
 方法三，通过文件直接创建DataFrame
 

猜你喜欢

转载自blog.csdn.net/qq_41705639/article/details/87728244

Spark2.0 概念

spark2.0的SparkSQLbug

深挖spark2.0

Spark2.0 shuffle service

spark2.0 AFTSurvivalRegression算法

Spark2.0操作Hbase

Spark2.0操作ES

spark2.0搭建standalone集群模式

Spark2.0安装配置文档

Spark2.0学习（二）--------RDD详解

spark2.0 新特性总结

Spark2.0读写Cassandra数据(scala)

spark2.0在IDE运行的问题

spark2.0版本的 DataFrame、DataSet 与 Spark sql

Spark2.0较于Spark1.x的更新之处

Spark实战（1）_Spark2.0环境搭建

spark2.0 用socket接收数据并处理

Spark2.0版本神器Structured Streaming

spark2.0访问ES5.1中的数据

图文解析Spark2.0核心技术(转载)

Spark2.0源码之3_Master

Spark2.0源码之2_TorrentBroadcast

Spark2.0源码之4_Worker

Spark2.0源码之1_Broadcast

CentOS7安装spark2.0集群

Spark2.0 一些新特性

解决升级Spark2.0之后，DataFrame map操作报错

学习Spark2.0中的Structured Streaming（一）

关于spark2.0使用UDF 这篇文章很清晰

spark2.0新特性－－执行计划

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)