CUDA Thrust sort 与C++ STL sort速度对比



1.测试平台:

CPU:Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10GHz       

GPU:nvidia tesla p100  

       

memory:32GB      

CUDA 9.0     GCC 4.8

2.试验结果

2.1 NVIDIA_CUDA-9.0_Samples/6_Advanced/radixSortThrust
 1000元素

 一百万元素


试验结果
元素个数 时间
1000 0.00045s
1十万 0.00025s
1百万 0.00098s
1千万 0.00266s
2.2 自己写的STL_sort与thrust_sort



试验结果:







第一次写博客,如有不足,请多谅解!






猜你喜欢

转载自blog.csdn.net/zzz594884756/article/details/79205307