第六章 CUDA性能优化

企业开发 2023-06-11 21:38:09 阅读次数: 0

第六章性能优化

《大规模并行处理器编程实战》学习，其他章节关注专栏 CUDA C

CUDA C 编程友情链接：

6.1 WARP 和线程执行

由于 SM（Streaming Multiprocessor）中实际由多个流处理单元（Streaming Processor, SP）进行单指令、多数据（SIMD）模式的执行，因此将线程块划分为 warp，方便调度给不同的 SP 执行。一般 warp 是 32 个线程。
在将线程划分时，按照多维数组变一维数组的映射进行32个线程的转化划分。
在这里插入图片描述

如果是三维，则先对 threadIdx.z=0 的二维进行线性排列，再对1,2…排列。
当一个 warp 中存在 if-else，循环次数不定等情况时，warp 就要进行分支（diverge），判断情况并执行。以加法归约算法说明分支的存在：
在这里插入图片描述

这是一个求和的并行加速算法，其本质是

在这里插入图片描述

可以发现，在第2,3，…次迭代中，越来越多的线程被闲置，处于分支状态。其算法复杂度如下：
在这里插入图片描述

可以通过对归约算法进行改进，从而提高硬件利用率，改进后的算法能让被使用的线程块越来越少，同时使用中的线程kernel不存在分支，多余的线程块block在逐次迭代中被释放出来，：
在这里插入图片描述

在这里插入图片描述

6.2 全局存储器的带宽

为了方便整块数据的存取，矩阵乘法中(b)的访问形式能够合并数据，即其threadIdx.y实变动的，threadIdx.x和x+1,x+2…能被一起取出，从而加速。而(a)中循环主体是threadIdx.x，不能连续取出x+1, x+2，无法进行存储加速。
在这里插入图片描述

本章学习时尚未记录，如要学习建议查看原书（百度云链接，提取码：cuda，有我做的笔记，望谅解），顺便送一本CUDA指南。

猜你喜欢

转载自blog.csdn.net/qq_40491305/article/details/116236526

第六章 CUDA性能优化

第六章查询性能优化

SQL优化第六章动态性能视图

第六章-查询性能优化

第六章：Jmeter 性能测试基础实战

第六章：web前端性能

高性能MySQL 第六章

【高性能MySQL】第六章查询性能优化查询优化器局限

【高性能MySQL】第六章查询性能优化查询优化

高性能mysql 第六章查询性能优化总结（上）查询的执行过程

【高性能MySQL】第六章查询性能优化

Linux性能优化第六章性能工具：磁盘I/O

高性能MySQL笔记(第六章查询性能优化) 01

高性能MySQL-第六章查询性能优化（1）

第六章——根据执行计划优化性能（3）——键值查找

第六章 JVM调优和深入了解性能优化笔记

redis第五第六章-redis并发缓存架构和性能优化

【高性能MySQL】第六章查询性能优化终自定义函数案例总结

第六章 Java性能调优工具（待续）

高性能Javascript第六章快速响应的用户界面

SpringBoot2.0实战 | 第六章：配置高性能服务器Undertow

GaussDB工作级开发者认证—第六章性能调优

视觉SLAM十四讲学习笔记——第六章非线性优化

MySQL深入学习——第六章查询优化&批量导入操作学习笔记

Node+WebSocket+Vue聊天室: 界面美化，代码优化 – 第六章

《unity游戏优化》第六章读书笔记

《nlp入门+实战：第六章：常见优化器算法的介绍》

【深度学习】第六章：模型效果评估与优化

第六章——根据执行计划优化性能（1）——理解哈希、合并、嵌套循环连接策略

第六章

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)