Udacity cs344Unit 4-Introduction to Parallel Programming笔记（超详细，CUDA，并行，GPU） - 代码天地

Udacity cs344Unit 4-Introduction to Parallel Programming笔记（超详细，CUDA，并行，GPU）

其他 2019-01-04 09:11:03 阅读次数: 0

1.啥是紧密（compact）：这里的压缩指的是过滤，filter，过滤出一个子集，也就是只留我们想要的（比如一把扑克牌里的方片）

（只计算我们关心的对象才更有意义，计算代价较小，需要更少空间）

2.

3.密集运算好一点？为啥

第一个稀疏运算要启动52个线程，而其中39个线程都是空的（线程成本较高）

第二个虽然过滤出方片会有成本，但是在接下来的映射步骤中它只启动13个线程

4.过滤的步骤

1）对每个元素进行判定

2）记录进数组里面

3）用不包含扫描的方法记录一共需要多少个地址

4）把过滤出来的结果放进地址里（放进输出数组里）

5.稀疏矩阵的表示方法

6.表示出来了怎么算？

将向量（x,y,z）与column的值相对应

列出column的xyz表示形式

之后对应相乘相加即可

本质是过滤掉了所有带0的项

所以越稀疏的矩阵越有效

7.排序（并行环境下）

奇偶排序法

8.归并排序

串行

并行

当归并到越顶层的时候，所占用的线程越少，也就是大部分SM都处于空闲状态，这是不利的，那么我们要考虑：

处理的三个阶段

9.双调排序网

什么是双调序列，为啥需要双调序列

只有一个转折点的就是双调序列

排序一个双调序列特别容易，为啥呢？

可以有效的缩小规模

10.单双归并排序

11.radix sort基数排序

将每个word的序号用二进制表示出来，从二进制表示数的最末位，把是0的按顺序排，再把是1的按顺序排

接着是倒数第二位，以此类推

一共交换的次数与二进制的位数相同

问题的解决难度与问题规模程正相关

12.快速排序

这就是递归，而到目前为止，我们所学的GPU是不支持递归的，那咋办？

先看自己手里有啥工具

13.键排序（比如按照年级排姓名。如果排的东西太大，就直接另存一下，记一个地址就行）

猜你喜欢

转载自blog.csdn.net/Ria_Ria/article/details/81117463

Udacity cs344Unit 4-Introduction to Parallel Programming笔记（超详细，CUDA，并行，GPU）

Udacity cs344Unit 1-Introduction to Parallel Programming笔记（超详细，CUDA，并行，GPU

Udacity cs344Unit 5-Introduction to Parallel Programming笔记（超详细，CUDA，并行，GPU）

Udacity cs344Unit 3-Introduction to Parallel Programming笔记（超详细，CUDA，并行，GPU）

Udacity cs344Unit 2-Introduction to Parallel Programming笔记（超详细，CUDA，并行，GPU）

Udacity并行计算课程 CS344 编程作业答案

并行程序设计——An Introduction to Parallel Programming学习

《Pro .Net 4 Parallel Programming in C#》笔记

Oracle Hints，Oracle并行模式（Parallel） /*+parallel(t,4)*/ 在SQL调优中的重要作用

Udacity 机器学习笔记1

Parallel 并行编程

oracle Parallel并行技术

Parallel 并行循环

concurrency（并发） & parallel （并行）

并行编程（Parallel Framework）

并行端口（Parallel Port）

学习笔记——并行编程Parallel

cuda parallel reduction

Udacity-cs101-building-a-search-engine

Parallel()

parallel

A Pattern Language for Parallel Application Programming

pyhton - parallel - programming - cookbook(THREAD)

并行的linuxshell命令gun parallel

并发(Concurrent) 与并行(Parallel) 的区别

bzoj 4131: 并行博弈 (parallel)

C#并行编程-Parallel

postgresql 11 的并行(parallel)简介

Oracle Parallel Execution(并行执行)

Oracle中并行parallel详解

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)