CUDA优化--核函数--浮点数类型转换

其他 2020-03-12 16:39:33 阅读次数: 0

在编写CUDA内核时，遇到一个问题，如下在核函数中使用一个2.1的浮点数，没有作类型声明，如（float）2.1或double(2.1)..

一. 实际上，cuda默认2.1是double，在核函数计算过程中进行了类型转换，流水线中arithmetic workload和单精度的计算峰值的分析结果如下：

好吃惊！！！43.98%用于FloatP64转换，35%用于数值计算，浪费太严重，峰值性能只有114.83GFlops。

内核的执行时间约为6000微妙左右。

二. 于是乎，提前对数据类型进行了声明，新的分析结果如下：

流水线中的类型转换被消除，峰值性能提身高300GFlops。内核的执行时间降低至2500微妙左右。

花了好几天的时间才注意到这个问题，还在那使劲地作访存优化

武泗海

发布了56 篇原创文章 · 获赞 30 · 访问量 6万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_17239003/article/details/79433340

CUDA优化--核函数--浮点数类型转换

mysql varchar类型转换int类型或者浮点数

浮点数精度的转换

浮点数与数组的转换

【Python】数据类型转换 ( 数据类型转换函数 | 整数 / 浮点数转字符串示例 | 字符串转整型 / 浮点型示例 | 整数 / 浮点数互相转换 )

数学函数&&浮点数

CUDA 半浮点数运算

MySQL 整数类型与浮点数类型

浮点数----自动转换----强制交换

整数与浮点数型别间的转换

关于浮点数的转换的问题

浮点数转换为整数

PHP intval 转换浮点数精度

php double 类型浮点数相减

double类型的浮点数的N次方

java浮点数据类型

C语言字符串类型转换为double浮点数类型

浮点数的指数函数的计算

python常见数据类型转换（字符串-整数-浮点数）

C#中byte[]4位数组转换为float类型浮点数

matlab 浮点数-定点数相互转换

C++浮点数转换为定点数

定点数、浮点数类型运算的说明

Python第二课：数据类型（字符串、整数、浮点数）、四则运算、字符串拼接、数据转换、type()函数

atoi( str ) 函数，将字符串转换为双精度浮点数

python3 使用int函数将浮点数转换成整数

JAVA浮点数浮点数转换成人民币读法

浮点数字符串转换成浮点数实现(2)

浮点数在计算机中存储方式、十六进制(HEX)和浮点类型(float、double)转换

Android NDK 编译优化：浮点数计算优化

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)