【cuda大师班】p12 主机和设备之间的数据传递 - 代码天地

【cuda大师班】p12 主机和设备之间的数据传递

企业开发 2023-05-07 20:06:57 阅读次数: 0

一.主机和设备之间的数据传递
1.1 基本流程框图
在这里插入图片描述
1.2 数据传递函数
在主机和设备之间必须显式的传递数据

1.3 代码
使用h_ 表示某个变量是主机变量
使用d_ 表示某个变量是主机变量

在这里插入图片描述

#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <stdio.h>
#include <stdlib.h>
#include <cstring>
#include <time.h>

__global__ void mem_trs_test(int* input)
{
    
    

	int gid = blockIdx.x * blockDim.x + threadIdx.x;
	printf(" tid : %d，gid : %d ,value: %d \n",
		threadIdx.x, gid, input[gid]);

}

int main()
{
    
    
	int size = 128;
	int byte_size = sizeof(int) * size;
	
	int* h_input;
	h_input = (int*)malloc(byte_size);

	time_t t;
	srand((unsigned)time(&t));

	for (int i = 0; i < size; i++)
	{
    
    
		h_input[i] = (int)(rand() & 0xff);
		printf("%d ", h_input[i]);
	}

	//在device中分配内存
	int* d_input;
	cudaMalloc((void**)&d_input, byte_size);
			//转化为泛型指针
	cudaMemcpy(d_input, h_input, byte_size, cudaMemcpyHostToDevice);

	dim3 block(64);
	dim3 grid(2);


	//访问全局
	mem_trs_test << <grid, block >> > (d_input);

	cudaDeviceSynchronize();
	//回收
	cudaFree(d_input);
	free(h_input);

	cudaDeviceReset();

	return 0;
}

使用指针直接指定是有弊端的。提供线程数（32的倍数）和需要的线程数（可能不是32的倍数）可能不能一一对应，余下线程应该不进行操作。

线程检查

__global__ void mem_trs_test2(int* input,int size)
{
    
    

	int gid = blockIdx.x * blockDim.x + threadIdx.x;
	//在执行前检查size
	if (gid < size)
	{
    
    
		printf(" tid : %d，gid : %d ,value: %d \n",
			threadIdx.x, gid, input[gid]);
	}
}

猜你喜欢

转载自blog.csdn.net/weixin_50862344/article/details/130448857

【cuda大师班】p12 主机和设备之间的数据传递

iOS证书(.p12)和描述文件(.mobileprovision)申请

p12文件和mobileprovision文件

p12证书和profile文件的生成方法

苹果证书p12和描述文件的创建教程

Elasticsearch：如何创建 Elasticsearch PEM 和/或 P12 证书？

keytool使用大全：p12(PKCS12)和jks互相转换等

Fragment和Activity之间的数据传递

苹果打包一——.p12证书和描述文件的申请

详解从p12证书提取RSA公私钥和序列号（小白向）

申请iOS证书(.p12)和描述文件(.mobileprovision)，用于Hbuilder打包测试

【2021】IOS证书(.p12)和描述文件(.mobileprovision)申请

在线创建ios正式打包的p12私钥证书和证书profile文件

仅使用p12文件和mobileprovision文件打包

Java p12

抽象数据类型 Triplet 的表示和实现（第一章：P12）

activity之间的数据传递

组件之间的数据传递

p12 pem 互转

导入P12证书

p12证书分离

制作p12证书

p12转pem

P12 添加 AutoMapper

Vue 12-父子组件间数据传递

第12篇 zephyr 数据传递之STACK

android 设备恢复，数据传递

【笔记】cuda大师班1-4

servlet与ajax之间的数据传递

记录activity之间的数据传递

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

timesten性能问题分析

hdu1017A Mathematical Curiosity

利用FragmentTabHost和ViewPager来实现可滑动切换的页面

哪里找卖百度云资源

大数据技能图谱

PHP设计模式（5）—— 观察者模式

python list删除元素是要注意的坑点

TPM简介

并查集擒贼先擒王//解密犯罪团伙

码农也要修身

每日归档

更多

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)