页锁主机内存

原文

运行时提供的函数允许使用分页锁定(也称为固定)主机内存(与malloc()分配的常规可分页主机内存相反):

  • cudaHostAlloc()cudaFreeHost() 分配和释放页锁定的主机内存;
  • cudaHostRegister() 将通过 malloc() 分配的内存的一定范围设置为页面锁定内存(限制参见参考手册)。

使用页面锁定的主机内存有几个好处:

  • 页面锁定的主机内存和设备内存之间的拷贝可以与内核执行并行执行,如异步并发执行中提到的一些设备。
  • 在某些设备上,锁定页面的主机内存可以映射到设备的地址空间,从而消除了将其复制到设备内存或从设备内存复制的需要(如映射内存所述)。
  • 在有前端总线的系统上,如果将主机内存分配为分页锁定,主机内存和设备内存之间的带宽会更高;如果将主机内存分配为写组合(如

猜你喜欢

转载自blog.csdn.net/panda1234lee/article/details/88933342