CUDA中的cudaMemcpy2D和cudaMallocPitch使用详解 - 代码天地

CUDA中的cudaMemcpy2D和cudaMallocPitch使用详解

其他 2018-07-09 21:25:50 阅读次数: 0

#include <stdio.h>  
#include <stdlib.h>  
#include <cuda_runtime.h> 
#define N 3 //类似数组的行
#define M 5 //类似数组的列
#define GridSize 16
#define BlockSize 16
#include<iostream>
using namespace std;

__global__ void kernel(float * d_matrix, size_t pitch) {
    int count = 1;
    for (int j = blockIdx.y * blockDim.y + threadIdx.y; j < N; j += blockDim.y * gridDim.y)
    {
        float* row_d_matrix = (float*)((char*)d_matrix + j*pitch);
        for (int i = blockIdx.x * blockDim.x + threadIdx.x; i < M; i += blockDim.x * gridDim.x)
        {
            row_d_matrix[i] = count;
            count++;
        }
    }
}

int main()
{
    float *d_matrix;
    float *dc_matrix = new float[M*N];
    //dc_matrix = (float*)malloc(sizeof(float)*M*N);
    size_t pitch;
    cudaMallocPitch(&d_matrix, &pitch, M*sizeof(float), N);
    for (int i = 0; i < M*N; i++)
        dc_matrix[i] = i;
    for (int i = 0; i < M*N; i++)
        printf("%.2f ", dc_matrix[i]);
    printf("\n");
    cudaMemcpy2D(d_matrix, pitch, dc_matrix, M* sizeof(float), M * sizeof(float), N, cudaMemcpyHostToDevice);

    kernel << <GridSize, BlockSize >> >(d_matrix, pitch);
    cudaMemcpy2D(dc_matrix, M * sizeof(float), d_matrix, pitch, M * sizeof(float), N, cudaMemcpyDeviceToHost);
    for (int i = 0; i < M*N; i++)
        printf("%.2f ", dc_matrix[i]);

    cudaFree(d_matrix);
    free(dc_matrix);
    return 0;
}

猜你喜欢

转载自blog.csdn.net/yujuan110/article/details/79072201

CUDA中的cudaMemcpy2D和cudaMallocPitch使用详解

二维数组 cudaMallocPitch() 和三维数组 cudaMalloc3D() 的使用

cudaMallocPitch()

使用Padding（cudaMallocPitch）的二维数组

卷积与解卷积详解：tf中conv2d和conv2d_transpose详解

Unity中2D和UGUI图集的理解与使用

详解unity中的SpringJoint2D

unity中的 SpringJoint2D 的详解

thinkphp中的M和D方法详解

PixelShuffle详解和cuda实现

Cuda中threadIdx、blockIdx、blockDim和gridDim的使用

CSS3新特性详解(三)：CSS3 2D转换和3D转换 transform 变形使用详解

CSS3新特性详解(三)：CSS3 2D转换和3D转换 transform 变形使用详解

css中2D和3D的区别

使用BabeLua3.x在cocos2d-x中编辑和调试Lua

使用BabeLua在Quick-cocos2d-x中编辑和调试Lua

使用BabeLua在cocos2d-x中编辑和调试Lua

tf.nn.conv2d和tf.nn.max_pool函数中same、valid详解

[cocos2d-x] --- CCScene和CCLayer类详解

css过渡和2d详解及案例

OpenCVSharp使用GPU和Cuda

在代码中 %d和%s的巧妙使用

CUDA中的统一内存详解

在启用 CUDA 的 WSL2 中运行 AI 模型，在 Windows 中为 LLM 和稳定扩散模型设置支持 CUDA 的 WSL2，而无需牺牲性能

ThinkPHP3.2.3中M()和D()的区别详解

cudaMemcpy学习笔记

Pytorch中torch.nn.Conv3D、torch.nn.Conv2D函数详解

Retrofit2详解和使用（一）

CUDA笔记--2D高斯卷积实现

pytorch之nn.Conv1d和nn.Conv2d超详解

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)