gencodeを埋めるためにどのようにNVCC

gencodeの2つの部分にアーチとコード:

12972719-b2b3a5a5fd360793.png
アーチ
12972719-59fbfd7394aa91be.png
コード

からの引用:

https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#virtual-architecture-feature-list

https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#gpu-feature-list

より一般的には:

フェルミ(CUDA 8までCUDA 3.2)(CUDA 9から非推奨):
SM20またはSM_20、compute_30 -そのようなのGeForce 400、500、600、GT-630のような古いカード

ケプラー(CUDA 5以降):
SM30またはSM_30、compute_30 -ケプラーアーキテクチャ(ジェネリック-テスラK40 / K80、のGeForce 700、GT-730)は、
統合メモリプログラミングのサポート追加
-より特定テスラK40 SM35またはSM_35、compute_35
ための追加のサポートがダイナミック並列処理。私の経験でSM30を超える本当の利益を示しません。
SM37またはSM_37は、compute_37 -より具体的なテスラK80は、
さらにいくつかのレジスタを追加します。私の経験でSM30を超える本当の利益を表示しません

マクスウェル(CUDA 6以降):
SM50またはSM_50、compute_50 -テスラ/ QuadroのM系列
SM52またはSM_52、compute_52 - QuadroのM6000、のGeForce 900、GTX-970、GTX-980、GTXタイタンX
SM53またはSM_53、compute_53 - Tegraは( JETSON)TX1 / TegraはX1

パスカル(CUDA 8以降)
SM60またはSM_60、compute_60 - QuadroのGP100、テスラP100、DGX-1(一般的なパスカル)
SM61またはSM_61、compute_61 - GTX 1080 GTX 1070 GTX 1060 GTX 1050 GTX 1030タイタンXP、テスラP40、テスラP4、NVIDIAドライブPX2上の離散GPU
SM62またはSM_62、compute_62 - NVIDIAドライブPX2、Tegraは(JETSON)TX2に統合されたGPU

ボルタ(CUDA 9以降)
SM70またはSM_70、compute_70 -ボルタ、テスラV100とDGX-1、GTX 1180(GV104)、タイタンV、QuadroのGV100
SM72またはSM_72、compute_72 - JETSON AGXザビエル

チューリング(CUDA 10以降)
SM75またはSM_75、compute_75 - GTXチューリング- GTX 1660のTi、RTX 2060 RTX 2070 RTX 2080タイタンRTX、QuadroのRTX 4000、QuadroのRTX 5000、QuadroのRTX 6000、QuadroのRTX 8000

ます。https://www.jianshu.com/p/1613e0eccaabで再現

おすすめ

転載: blog.csdn.net/weixin_33895695/article/details/91173284