cuda程序的组织（与C++融合）

其他 2018-05-25 21:00:56 阅读次数: 0

cuda程序的组织（与C++融合）

前言：

我们都希望有一个好的cuda程序组织方式，让我们的代码或程序变得干净整洁，不容易出错，可以移植性能强。今天介绍一种最基础CUDA程序组织方式。

我们都知道面向对象程序的好处，或者说，我们现在有一个C++程序需要并行化。我们不得不让CUDA程序与C++相融合，但cuda是基于c语言的，怎样组织cuda程序就尤为关键了。

问题：

由于有关CUDA的程序是基于C语言的，kernel不能被类直接调用，但为了实现面向对象的封装功能，需要借助namespace：。

几个定义：

调用kernel的函数（后面叫它调用函数）：在C++的类中，不能直接调用kerenl函数，需要调用一个函数，通过这个函数间接调用kernel。
C++类：像普通的C++程序一样，对对象进行封装，唯一不同的是在需要并行计算的地方，使用调用函数，完成并行计算的任务。
kernel函数：并行计算，在GPU端运行的函数。

一般C++中的cuda程序是这样的：

定义一个类便于我们面向对象编程。
使用namespace 将cuda需要的全局变量（如常量，纹理等变量），调用函数的实现和kernel函数的实现，定义到一个cu文件中。

类中调用调用函数，调用函数调用kerenl函数。（其中注意头文件顺序，保证可以访问到，ps .cu文件可直接被inlcude）

实例：

OpenCV中关于GPU SURF的实现方式。参看surf.cuda.cpp和surf.cu。

猜你喜欢

转载自blog.csdn.net/fb_help/article/details/80150659

cuda程序的组织（与C++融合）

C#程序的组织结构

CUDA的内存组织

C++构造函数和文件组织

C++实验---大学的组织架构

基于C++与CUDA的N卡GPU并行程序——cuBLAS简介

基于C++与CUDA的N卡GPU并行程序——OpenGL图形互操作性

基于C++与CUDA的N卡GPU并行程序——内存操作

基于C++与CUDA的N卡GPU并行程序——随机数生成、数组求和

在C++项目中集成CUDA程序加速（从环境配置讲起）

IHS融合（Xcode+Gdal，C++）

C++ OpenCV 图像拼接融合

CUDA & C++ | 测试环境安装成功 Hello，CUDA！

CUDA: (十) 使用 CUDA C/C++ 统一内存和 nvprof 管理加速应用程序内存 (NVIDIA 课程 Part three)

CUDA: (十二) 异步流及使用 CUDA C/C++ 对加速应用程序开展可视化分析 (NVIDIA 课程 Part four)

基于C++与CUDA的N卡GPU并行程序——在python中使用numba库编写GPU程序

基于C++与CUDA的N卡GPU并行程序——在python中使用pyCUDA编写GPU程序

C++多线程及CUDA编程（一）

K-Means in Python, C++ and CUDA

C++与CUDA混合编程

CUDA & C++ | 双变量加法

自己的完整c++ cuda包

onnxruntime (C++/CUDA) 编译安装

c++/cuda并行累计求和

在Windows上创建CUDA C程序

基于C++与CUDA的N卡GPU并行程序——二维矩阵索引、按行求和、矩阵乘法

算法与数据结构【C++】：自组织链表

C程序怎样组织更有结构性

ubuntu下C，C++，opencv cuda编程

C++和cuda C的结合发挥各自的优点

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)