bypass SortShuffleManager的bypass运行机制 - 代码天地

bypass SortShuffleManager的bypass运行机制

其他 2019-11-23 10:17:45 阅读次数: 0

bypass运行机制

下图说明了bypass SortShuffleManager的原理。bypass运行机制的触发条件如下：

shuffle map task数量小于spark.shuffle.sort.bypassMergeThreshold参数的值。
不是聚合类的shuffle算子（比如reduceByKey）。

此时task会为每个下游task都创建一个临时磁盘文件，并将数据按key进行hash然后根据key的hash值，将key写入对应的磁盘文件之中。当然，写入磁盘文件时也是先写入内存缓冲，缓冲写满之后再溢写到磁盘文件的。最后，同样会将所有临时磁盘文件都合并成一个磁盘文件，并创建一个单独的索引文件。

该过程的磁盘写机制其实跟未经优化的HashShuffleManager是一模一样的，因为都要创建数量惊人的磁盘文件，只是在最后会做一个磁盘文件的合并而已。因此少量的最终磁盘文件，也让该机制相对未经优化的HashShuffleManager来说，shuffle read的性能会更好。

而该机制与普通SortShuffleManager运行机制的不同在于：第一，磁盘写机制不同；第二，不会进行排序。也就是说，启用该机制的最大好处在于，shuffle write过程中，不需要进行数据的排序操作，也就节省掉了这部分的性能开销。

猜你喜欢

转载自www.cnblogs.com/sunpengblog/p/11915439.html

bypass SortShuffleManager的bypass运行机制

ByPass

XSS Bypass

Bypass WAF

rfi bypass

bypass命令

11. xss bypass aliyunwaf bypass

Linux Restricted Shell Bypass

Bypass SSL security check

xss bypass 学习记录

/*+ BYPASS_UJVC*/

imperva 软bypass

恶意软件的bypass

Best Bypass WAF

AVIator -- Bypass AV tool

闲谈 bypass AV

闲谈 bypass AV

XXS Bypass 实战案例

什么是bypass（转载）

sudo 1.2.27 - Security Bypass

SPDK - Kernel bypass for NVMe

Command injection - Filter bypass

CG CTF bypass again

bypass名词解释

Bypass-BT

thinkphp-getshell Bypass

bypass 之报错注入

Fastjson 1.2.68 bypass autotype

8. xss bypass

Kernel Bypass & DPDK

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)