cuda编程---第一个cuda程序 - 代码天地

cuda编程---第一个cuda程序

其他 2018-10-30 21:11:27 阅读次数: 0

版权声明：本文为博主原创文章，转载请加入原文链接，谢谢。。 https://blog.csdn.net/shawncheer/article/details/77929728

前言：: 1、参考： nvidia offical tutorial; 2、使用 nvcc 编译程序，并且加-g -G 参数进行编译，以保存调试信息，之后可以用cuda-gdb 进行单步调试。

程序:

#include <iostream>
#include <math.h>

//CUDA Kernel function to add the elements of two arrays on the GPU.
__global__
void add(int n,float *x, float *y)
{   int index= blockIdx.x*blockDim.x+threadIdx.x;
    int stride=blockDim.x*gridDim.x;
    for(int i=index;i<n;i+=stride)
    y[i]=x[i]+y[i];
}

int main(void){
    int N = 1 << 20; //1M element.

    //float *x=new float[N];
    //float *y=new float[N];

    //Allocate Unified Memory -- accessible from CPU or GPU
    float *x,*y;
    cudaMallocManaged(&x,N*sizeof(float));
    cudaMallocManaged(&y,N*sizeof(float));

    //initialize x and y arrays on the host.
    for (int i=0;i<N;i++){
        x[i]=1.0f;
        y[i]=2.0f;
    }

    int blockSize = 256;
    int numBlocks = (N + blockSize -1) /blockSize;

    //run kernel on 1M elements on the CPU.
    add<<<numBlocks,blockSize>>>(N,x,y);

    //Wait for GPUto finish before accessing on host.
    cudaDeviceSynchronize();

    // Check for errors (all values should be 3.0f)
    float maxError=0.0f;
    for (int i=0;i<N;i++)
        maxError=fmax(maxError,fabs(y[i]-3.0f));
    std::cout << "Max error: " <<maxError<<std::endl;

    //Free memory
    cudaFree(x);
    cudaFree(y);

    return 0;
}

猜你喜欢

转载自blog.csdn.net/shawncheer/article/details/77929728

cuda编程---第一个cuda程序

CUDA 编程：第一个CUDA程序

cuda编程学习——第一个cuda程序！干货向（一）

CUDA编程学习1——第一个小程序

第一个cuda代码

CUDA学习笔记（三）之第一个CUDA程序及计时

CUDA学习笔记（三）：第一个cuda程序

CUDA教程之2：第一个CUDA程序

CUDA教程之3：第一个CUDA程序的优化

3.2.cuda运行时API-第一个运行时程序，hello-cuda

详解第一个CUDA程序kernel.cu

win10 cuda_小白之旅（2）：第一个应用程序

win10 cuda_小白之旅（4）：编写第一个cuda kernel

【CUDA-2】第一个CUDA代码例子——hello world

如何理解Cuda中的cudaMalloc函数的第一个参数是两个星星？

Go基础编程：第一个Go程序

编制第一个汇编程序

第一个汇编程序

Dart编程实例 - 第一个Dart程序

编译第一个汇编程序

四、第一个汇编程序

JAVA编程之第一个程序HelloWorld

CUDA入门笔记（三）GPU编程基础——一个典型GPU程序

第一个servlet程序

第一个tensorflow程序

第一个Hive程序

第一个Spark程序

第一个小程序

pig的第一个程序

第一个Smarty程序

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)