Ubuntu16.04：CUDA学习笔记（一）：GPU背景知识

其他 2018-11-13 10:31:04 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/renhaofan/article/details/83897564

host：CPU，内存
device：GPU，显存
我是纯粹小白，里面的一些图是根据我自己的理解画的，可能并不一定对

一，GPU和CPU执行程序的区别

在这里插入图片描述（图片来源：CUDA_C_Programming-Guide）
可以看到GPU有跟多的cores，你可以先把cores理解成计算的最小的单元。

通常来说，访问数据的时间随着计算核和存储数据的内存位置的距离而增加
Latency延迟是核等待数据的时间。

CPU是通过大量的告诉缓存cache来缩短这个时间的，也就是尽可能减少时间t来减小延迟，CPU关注单个核心的执行速度
在这里插入图片描述
如果warp1所需要的而数据不可以获得的话，那么SM就会转向一个可以获得数据的线程束。GPU所关注的是整体的运算吞吐量，而不是单个核心的执行速度

如何产生大量的线程？
CUDA通过一种叫做核函数（kernel）的特殊函数去实现的，这个函数会产生大量的可以分配SM的计算线程

二，GPU的背景知识

GPU的每一个core（计算核心）都有两个计算单元
在这里插入图片描述

输出指令之后GPU执行程序的流程，也就是所谓的SIMT（single instruction multiple threads）

SM中每一个core执行的具体的运算是不一样的，有CUDA统一调度
SM是借用一种特殊的函数–核函数（kernel）去执行的。具体执行的时候是这样去做的：
在这里插入图片描述
（图片来源：https://blog.csdn.net/breaksoftware/article/details/79302590 by breaksoftware）

参考

《CUDA高性能并行计算》机械工业出版社
CUDA_C_Programming-Guide
CUDA高性能编程入门

猜你喜欢

转载自blog.csdn.net/renhaofan/article/details/83897564

Ubuntu16.04：CUDA学习笔记（一）：GPU背景知识

CUDA入门笔记（一）GPU设计思路、背景知识

ubuntu16.04下安装CUDA，cuDNN及tensorflow-gpu

ubuntu16.04 +cuda + cuDNN及tensorflow-gpu

CUDA Sample ：ubuntu16.04下基于GPU的Julia

ubuntu16.04 cuda9.0 cudnn Tensorflow GPU 1.10.0

GPU环境部署：Ubuntu16.04 + GPU Tesla V100 + CUDA + CuDNN

Ubuntu16.04安装CUDA

Ubuntu16.04：CUDA学习笔记（二）：环境以及必备工具配置

docker学习笔记（一）—— ubuntu16.04下安装docker

ubuntu16.04配置深度学习GPU环境

Ubuntu16.04 +Caffe CPU/GPU 深度学习环境

Ubuntu16.04系统GPU深度学习环境搭建

#Ubuntu16.04 深度学习环境搭建流程GPU版

ubuntu16.04安装nvidia384.111+cuda9.0+cudnn7.04+tensorflow-gpu1.7+opencv3.2

Ubuntu16.04 安装显卡驱动+cuda8.0+cudnn-v6+TensorFlow-gpu

ubuntu16.04下安装CUDA，cuDNN及tensorflow-gpu版本过程

Ubuntu16.04下CUDA 9.0 + cuDNN v7.0 + tensorflow 1.6.0（GPU）环境搭建

Ubuntu16.04安装caffe+CUDA8.0+cuDNN GPU version

Ubuntu16.04安装CUDA+cuDNN+GPU版TensorFlow过程记录

ubuntu16.04上安装CUDA8.0 + cuDNN v6 + tensorflow-gpu1.4

Ubuntu16.04 + cuda9.0 + cudnn_v7 + tensorflow-gpu + opencv3.4.2

ubuntu16.04安装Nvidia显卡驱动,CUDA8.0,cuDNN6,TensorFlow-gpu

Ubuntu16.04配置tensorflow-gpu环境（CUDA+cuDNN）

Ubuntu16.04 CUDA8.0+caffe+gpu运行环境配置

Ubuntu16.04 cuda8.0+cudnn6.0+python3.5 配置tensorflow-gpu 1.4.0

Ubuntu16.04下Anaconda3+CUDA9.0+cuDNN7.0+tensorflow-gpu1.8安装

Ubuntu16.04 cuda 10.0安装 anaconda3+mxnet gpu版本

Ubuntu16.04安装anaconda3++CUDA9.0+cuDNN7.1+TensorFlow-gpu1.9.0

重装win10系统、ubuntu16.04（CUDA+CUDNN+Tensorflow-gpu）系统的参考博客

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)