版权声明:本文为博主原创文章,未经博主允许不得转载。--KevinYu https://blog.csdn.net/qq_16898611/article/details/79996182
同步性和屏障
同步性synchronisation和屏障barrier。
不同的线程在共享和全局内存中读写数据需要有先后的控制。屏障的作用:用来控制多个线程的停止与等待,当所有线程都到达了屏障点,程序才继续运行。
CUDA负责完成的事情
1.从CPU同步数据到GPU
2.从GPU同步数据到CPU
3.(1、2使用cudaMemcpy)
4.给GPU分配内存
5.加载Kernel到GPU上,并开始计算