书籍 opencl异构计算

版权声明:转载请注明出处 https://blog.csdn.net/fan_lulu/article/details/83339861

本书将介绍在复杂环境下的OpenCL和并行编程。这里的复杂环境包含多种设备架构,比如:多芯
CPU,GPU,以及完全集成的加速处理单元(APU)。

OpenCL 2.0最新的改进:
共享虚拟内存(Shared virtual memory)可增强编程的灵活性,从而能大幅度减少在数据转换
上所消耗的资源和精力
动态并行(Dynamic parallelism)将减少处理器上的负载,并避免瓶颈出现
对图像的支持有很大改善,并且集成OpenGL

内存模型:在一般情况下,计算平台之间的内存子系统差异巨大。例如现代CPU都支持自动缓存,不过很多GOU并不支持。为了支持代码的可移植性,Opencl采用的方法是定义一个抽象的内存模型,编程人员可以根据给模型编写代码,厂商可以映射到他们自己实际的内存硬件。

 一旦work-item执行完成,其状态信息和使用的本地内存都是临时的,如果需要保存计算结果,必须将结果回传到全局内部。

 

 

猜你喜欢

转载自blog.csdn.net/fan_lulu/article/details/83339861