CUDA编程：Thread，Block，Grid - 代码天地

CUDA编程：Thread，Block，Grid

其他 2018-08-27 13:17:43 阅读次数: 0

版权声明：本文为博主原创文章，未经作者允许请勿转载。 https://blog.csdn.net/heiheiya https://blog.csdn.net/heiheiya/article/details/81558660

Thread是CUDA最基本的执行单元，多个threads组成一个block，多个blocks组成grid。

现在的GPU一个block最多可以分配1024个threads。

Block中的threads可以是一维、二维、三维的，grid中的blocks也可以是一维、二维、三维的。Block可以通过内建变量blockIdx索引，block的维度可以用dim3类型的内建变量blockDim访问。

// Kernel definition
__global__ void MatAdd(float A[N][N], float B[N][N],
float C[N][N])
{
    int i = blockIdx.x * blockDim.x + threadIdx.x;
    int j = blockIdx.y * blockDim.y + threadIdx.y;
    if (i < N && j < N)
        C[i][j] = A[i][j] + B[i][j];
}
int main()
{
    ...
    // Kernel invocation
    dim3 threadsPerBlock(16, 16);
    dim3 numBlocks(N / threadsPerBlock.x, N / threadsPerBlock.y);
    MatAdd<<<numBlocks, threadsPerBlock>>>(A, B, C);
    ...
}

猜你喜欢

转载自blog.csdn.net/heiheiya/article/details/81558660

CUDA编程：Thread，Block，Grid

cuda编程之thread，block and grid

CUDA编程——GPU架构，由sp，sm，thread，block，grid，warp说起

CUDA中grid、block、thread、warp与SM、SP的关系

CUDA：网格（Grid）、线程块（Block）和线程（Thread）

CUDA简介——Grid和Block内Thread索引

GPU的硬件结构中与CUDA相关的几个概念：thread block grid warp sp sm

CUDA软件架构—网格（Grid）、线程块（Block）和线程（Thread）的组织关系以及线程索引的计算公式

CUDA C 权威编程指南 sumMatrixOnGPU-2D-grid-2D-block

1. CUDA中的grid和block

CUDA之单thread单block&多thread单block&多thread多block

cuda 多block多thread实现

CUDA 关于 BLOCK数目与Thread数目设置

CUDA:(二)对于Block， thread的简单理解

CUDA编程（七）共享内存与Thread的同步

CUDA程序block和thread超出硬件允许值时的异常

cuda 单block多线程

[CUDA] CUDA编程入门

../aten/src/ATen/native/cuda/IndexKernel.cu:92: operator(): block: [651,0,0], thread: [127,0,0] Asse

CUDA编程

cuda 编程

Win32 Thread Information Block

[CUDA]CUDA C并行编程

CUDA编程之CUDA流

CUDA之Thread、Wrap执行详解

用Block实现链式编程

Thread与并发编程

CUDA编程——zero copy

CUDA编程模型

cuda编程之 __syncthreads()

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

第五讲：AbstractBean以及Ioc常见注解使用和自动装配

python-re模块学习-正则表达式

黑客攻击常用手段

正则表达式的规则

windwos::mutex

Spring中日志的使用（log4j）

Bootstra5 按钮处理

JVM内存结构-这一篇全部了解

Android的低级错误

Oracle中Cursor, A表a1字段值复制到B表b1字段

每日归档

更多

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)