【Spark】Spark内部通信机制 - 代码天地

【Spark】Spark内部通信机制

编程语言 2020-03-31 10:12:50 阅读次数: 0

一直以来，基于Akka实现的RPC通信框架是Spark引以为豪的主要特性，也是与Hadoop等分布式计算框架对比过程中一大亮点，但是时代和技术都在演化，从Spark1.3.1版本开始，为了解决大数据块（如shuffle）的传输问题，Spark引入了Netty通信框架，到了1.6.0版本，Netty居然完全取代了Akka，承担Spark内部所有的RPC通信以及数据流传输。

那么Akka又是什么东西？从Akka出现背景来说，它是基于Actor的RPC通信系统，它的核心概念也是Message，它是基于协程的，性能不容置疑；基于scala的偏函数，易用性也没有话说，但是它毕竟只是RPC通信，无法适用大的package/stream的数据传输，这也是Spark早期引入Netty的原因。

那么Netty为什么可以取代Akka？首先不容置疑的是Akka可以做到的，Netty也可以做到，但是Netty可以做到，Akka却无法做到，原因是啥？在软件栈中，Akka相比Netty要Higher一点，它专门针对RPC做了很多事情，而Netty相比更加基础一点，可以为不同的应用层通信协议（RPC，FTP，HTTP等）提供支持，在早期的Akka版本，底层的NIO通信就是用的Netty；其次一个优雅的工程师是不会允许一个系统中容纳两套通信框架，恶心！最后，虽然Netty没有Akka协程级的性能优势，但是Netty内部高效的Reactor线程模型，无锁化的串行设计，高效的序列化，零拷贝，内存池等特性也保证了Netty不会存在性能问题。

那么Spark是怎么用Netty来取代Akka呢？一句话，利用偏函数的特性，基于Netty“仿造”出一个简约版本的Actor模型！！

发布了91 篇原创文章 · 获赞 342 · 访问量 26万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_43733123/article/details/105194686

【Spark】Spark内部通信机制

Spark内部执行机制

【Spark】Spark 运行消息通信

【Spark】Spark 启动消息通信

【Spark】Spark 消息通信架构

Spark（四） -- Spark工作机制

Spark 通信原理分析

Spark之RPC通信

Spark通信架构（转载）

Spark通信架构

Spark组件间通信

Spark容错机制

Spark checkpoint机制简述

spark-checkpoint机制

[spark内核]shuffle机制

Spark Streaming的工作机制

Spark的工作机制

Spark缓冲、容错机制

Spark Shuffle机制

Spark架构与工作机制

spark的shuffle机制

Spark:排序机制

Spark之pipeline机制

Spark的Shuffle机制解析

Spark工作机制

Spark | checkpoint机制

Spark的数据容错机制

Spark RDD容错机制

Spark架构原理-Spark启动消息通信

【Spark架构】Spark消息通信原理

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)