CUDA学习笔记——并行编程的通讯模式

并行计算:非常多的线程在合作解决一个问题。

1. 映射Map

2. 聚合gather

3. 分散scatter

4. 模板stencil

5. 转换transpose

6. 压缩reduce

7. 重排scan/sort

1.映射Map,一一对应,举例:把数组x的每一个元素都放大三倍,输出到数组y

2.聚合gatter:多对一,举例:把数组x[0]+x[1]+x[2]取均值放到y[0],把数据x[1]+x[2]+x[3]取均值放到y[1]…… 

3.分散scatter,一对多,与第二点相反

4.模板stencil,如图所示

5.转置transpose, 如图所示

6.压缩reduce,逐步减少,类似映射Map

7.重排 scan/sort ,以我们希望的一种计算模式进行重新排列,输入的数量不一定

猜你喜欢

转载自blog.csdn.net/nienelong3319/article/details/81410741