CUDA（二）并行程序设计概述 - 代码天地

CUDA（二）并行程序设计概述

其他 2018-10-22 08:58:39 阅读次数: 0

串行计算模式

常规软件是串行的

设计运行于一个中央处理器上（CPU）

通过离散的指令序列完成一个问题的解决

一条一条指令的执行

同时只有一条指令在执行

并行计算模式

并行计算是同时应用多个计算资源解决一个计算问题

涉及多个计算资源或处理器

问题被分解为多个离散的部分，可以同时处理（并行）

每个部分可以由一系列指令完成。

每个部分的指令在不同的处理器上执行

概念：

Flynn 矩阵

SISD

single Instruction,Single Data

SIMD

Single Instruction, Multiple Data

MISD

Multiple Instruction, Single Data

MIMD

Multiple Instruction, Multiple Data

常见名词

Task（任务）：可完整得到结果的程序，一个或者若干个代码段，相对独立。

Parallel Task (并行任务)：可用并行计算解决的一个任务。

Serial Execution（串行执行）：一串

Parallel Execution（并行执行）：

Shared Memory（共享存储）：

Distributed Memory（分布式存储）：

Communications（通信）：并行单元需要交互

Synchronization（同步）：相同的执行顺序，破坏了独立性原则。导致性能下降

Granularity（粒度）：任务划分，每个任务大小

ObservedSpeedup（加速比）：对比标志程序并行程序的性能提升。同层次计算性能的比较。

Parallel Overhead（并行开销）：为了完成并行预算的开销，通信的开销最大。

Scalability（可扩展性）：核数增加后加速比是否为线性增加。

存储器架构

Shared Memory

Distributed Memory

Hybrid Distributed-Shared Memory混合分布式共享存储

并行编程模型

共享存储模型Shared Memory Model：所有处理单元去共享存储器取数据

线程模型Threads Model:开多个线程，线程切换，数据放置比较近

消息传递模型 Message Passing Model:MPI独立存储单元，消息模式传递

数据并行模型 Data Parallel Model：数据进行切分

具体实例

OpenMP

MPI

SPMD(Single Program Multiple Data)：每一个代码段处理

MPMD(Multiple Program Multiple Data)：多个任务同时处理

设计并行处理程序和系统

自动和手动并行：单一模式下自动模式很好了，负责模型需要手动并行。

理解问题和程序：理解要处理问题的特性，并行的部分在哪里。

分块分割：数据分块和任务分割。

通信：不同分块分区之间数据交互，开销比较大，可扩展性影响较大部分

同步：步调一致

数据依赖：

负载均衡：多个独立人物之间负荷，是否均衡

粒度：任务细分大小

I/O：

成本：

性能分析和优化：

数据和任务的分割：

通信和同步：

同步:broadcast scatter gather reduction

Amdahl's Law

程序可能的加速比取决于可以被并行化的部分 $speedup=\frac{1}{1-P}$

如果没有并行化 $P=0$ and the speedup=1(no speedup)

如果全部可以并行化 $P=1$ and the speedup is infinite(in theory)

如果50%则可以冰箱话, maximum speedup=2。

如果有N个处理器并行处理 $speedup=\frac{1}{\frac{P}{N}+S}$

P=并行部分，N=处理器数码，and S=串行部分

并行化的可扩展性极限

猜你喜欢

转载自blog.csdn.net/fanre/article/details/83061545

CUDA（二）并行程序设计概述

NVIDIA CUDA初级教程视频 - 学习笔记（二）并行程序设计概述

【CUDA并行程序设计系列（4）】CUDA内存

并行程序设计

【CUDA并行程序设计系列（2）】CUDA简介及CUDA初步编程

【CUDA并行程序设计系列（3）】CUDA线程模型

《并行程序设计（第二版）》.pdf

c语言并行程序设计的思考（二）

CUDA并行程序设计开发环境搭建与远程调试

【CUDA并行程序设计系列（1）】GPU技术简介

OpenMP并行程序设计（一）

并行程序设计小结

OpenMP并行程序设计——for循环并行化详解

MPI并行程序设计——Eclipse开发环境的搭建

OpenMP并行程序设计——Eclipse开发环境的搭建

Java多线程和并行程序设计

并行程序设计模式之 -> Future模式

Java并行程序设计模式——Guarded Suspension模式

Java并行程序设计模式——Future模式

[并行程序设计] 多线程pthread编程笔记

并行程序设计——An Introduction to Parallel Programming学习

并行程序设计——概论和背景知识

并行程序设计——HPCC性能测试branchmark

并行程序设计模式-Future模式

基于C语言实现并行程序设计

多线程和并行程序设计

并行计算程序设计(CUDA C)

并行程序设计报告(MPI并行计算π，实现mandelbrot集）

并行与分布式计算导论（三）并行程序设计的基本原则

并行程序-线程(二)

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)