[cuda]常量内存 - 代码天地

[cuda]常量内存

编程语言 2018-05-13 15:20:32 阅读次数: 0

我们在cuda编程中定义变量的时候，可以用__constant__来修饰定义，代表着定义了一个常量内存。向常量内存中拷贝数据的时候不再使用cudaMemcpy，而改为使用cudaMemcpyToSymbol。对于常量内存，不需要在使用完成后用cudafree释放空间。

常量内存带来的性能提升

__constant__把对变量的访问限制为只读，跟从全局内存读取数据相比，从常量内存读取相同的数据可以节约内存带宽，原因是对常量内存的单次读操作可以广播到同一个线程块内的其他线程(节约15次读操作)。且常量内存的数据将被缓存起来，对相同地址的连续读操作将不会产生额外的内存通信量。

为了方便理解，写了一个用常量内存给数组赋值的程序。

#include<cuda_runtime.h>
#include<windows.h>
#include<iostream>
using namespace std;
const int nMax = 50;

__constant__ float num1[40];
__global__ void exchangeKernel(float *aaa)
{
	int offset = threadIdx.x + blockDim.x * blockIdx.x;
	aaa[offset] = num1[offset];
}

int main(){
	float *devA,tmp[40],res[40];
	cudaMalloc((void**)&devA, 40*sizeof(float));
	for (int i = 0; i < 40; i++)tmp[i] = i*1.5f;
	cudaMemcpyToSymbol(num1, tmp, 40 * sizeof(float));
	exchangeKernel << <4, 10 >> >(devA);
	cudaMemcpy(res, devA, 40 * sizeof(float), cudaMemcpyDeviceToHost);
	for (int i = 0; i < 40; i++){
		cout << res[i] << " " << endl;
	}
	cin >> res[1];
	return 0;
}

猜你喜欢

转载自bbezxcy.iteye.com/blog/2264048

[cuda]常量内存

CUDA（Ⅵ）：常量内存（Constant Memory）

CUDA By Example笔记--常量内存与事件

VS2017 CUDA编程学习9：常量内存

CUDA编程：主机内存与CUDA常量存储器的数据传输

CUDA简介——CUDA内存模式

[CUDA]共享内存

CUDA内存分配

CUDA 纹理内存

CUDA 之共享内存

CUDA中的内存效率

CUDA——向量化内存

CUDA共享内存详解

CUDA的内存组织

cuda编程学习——CUDA内存介绍（七）

（六）id(),is和==，内存常量

Java内存中的常量池

栈内存与文字常量区

CUDA学习五：纹理内存

【CUDA】分配内存使用void**

CUDA 共享内存 bank conflict

关于CUDA 分配固定内存

CUDA（Ⅷ）：纹理内存（Texture Memory）

CUDA全局内存读取

CUDA统一内存UVA

CUDA中的图内存节点

CUDA编程（四）：内存管理

【CUDA并行程序设计系列（4）】CUDA内存

cuda编程学习——CUDA共享内存性能优化（九）

cuda编程学习——CUDA全局内存性能优化（八）

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)