Cuda Streams的概述（一） - 代码天地

Cuda Streams的概述（一）

其他 2020-05-16 10:50:09 阅读次数: 0

最近在做有关Cuda的一个项目，碰到匪夷所思的问题，在异步的时候发现并没有达到预期的效果，程序没有异步起来，然后在网上找了一个Nvida的有关Cuda Streams的一个ppt，然后照着里面的提示，使程序达到了异步的效果。

首先，先回顾一下简单的简单的处理流程。

在这里插入图片描述

将数据从CPU内存中拷贝到GPU内存中。
启动一个GPU的kernel。
将结果从GPU内存中拷贝到CPU的内存中。
重复上面的操作。
在Pipelining中的并发相比于串型可以提高性能。

我们可以发现在并发的情况下，程序的运行速度有显著提高。在Tile DGEMM的实验中，将CPU的浮点数运算作为baseline，当串型使用GPU（K20X）时，达到519Gflop/s（提高2.3倍），当两路并发时，达到了663Gflop/s(提高3倍)，当3路并发时，速度达到990Gflops/s（提高4倍），在GPU和CPU同时的4路并发中，速度达到了1180Gflops/s（提高了5.3倍）。

通过MPS（Multi-process service）进行并发

背景介绍：

要求每一个进程拥有唯一的context。
设备上一次只能有一个context处于活跃状态。
在单GPU上的多个进程不能并发操作。

MPS是驱动和应用之间的软件层。

可以一个context可以涵盖所有的CUDA调用。
多个进程可以并发的进行处理。

MPS的优点：

Oversubscribe MPI 进程并自动进行并发操作。
简单自然的加速路径。（特别是当应用中已经准备好MPI）

MPS的缺点：

MPS增加了启动的延迟。
在旧的硬件上不支持。（Kepler或者之后的架构）
只能在Linux上使用

鉴于MPS的局限性，可以考虑通过Streams方式来进行并发。

通过Streams进行并发

Cuda调用对于主机端来说不是同步的就是异步的，

同步：把work入队然后等待工作完成。
异步：work入队之后立刻返回。
运行的kernel会自动异步地overlap主机端。

在这里插入图片描述

大脸猫脸大主持人猫脸大

原创文章 5 获赞 3 访问量 111

关注私信

猜你喜欢

转载自blog.csdn.net/huikougai2799/article/details/106130024

Cuda Streams的概述（一）

Cuda Streams的概述（二）

Cuda Streams的概述（三）

CUDA（一）

【CUDA学习笔记（一）】CUDA概述和编程模型

【CUDA入门笔记】概述

CUDA学习(一)——前言

CUDA学习笔记（一）

CUDA 学习笔记一

CUDA(一)周斌

CUDA入门（一）

CUDA学习笔记一

cuda矩阵编程（一）

CUDA学习笔记 (一)

CUDA编程（一）安装

计算机视觉基于CUDA编程的入门与实践 CUDA Streams五

cuda

CUDA算法效率提升关键点概述

2.1.cuda驱动API-概述

CUDA（一）—基础知识

CUDA入门(一)环境安装

cuda并行编程基础（一）

cuda基本知识（一）

（Cuda）基础知识（一）

CUDA学习系列教程（一）

cuda的一些东西

CUDA统一内存UVA

一文搞懂CUDA

CUDA C最佳实践-CUDA Best Practices(一)

CUDA学习笔记（一）之CUDA安装及GPU硬件介绍

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)