1.前情提要
- 本文使用cuda10.1,cuda8不行,cuda9没试过
- cudnn要使用显卡以后发布的版本,GTX1660发布于
20190222
- 考虑到官网总是挂,可以在此下载cuda10.1,cudnn
- cudnn的developer版本安装失败,runtime版本缺少头文件,所以安装runtime版本,使用developer版本是头文件,注意头文件的命名
2.编译caffe遇到的问题
- 1、Check failed: error == cudaSuccess (8 vs. 0) invalid device function
- 计算能力不匹配(如果驱动和软件匹配可能不会遇到这个问题)
- 修改
Makefile.config
中的CUDA_ARCH
,重新编译 -gencode arch=compute_62,code=[sm_62,compute_62]
尚未试验的方法
CUDA_ARCH := -gencode arch=compute_30,code=sm_30 \ -gencode arch=compute_35,code=sm_35 \ -gencode arch=compute_50,code=sm_50 \ -gencode arch=compute_52,code=sm_52 \ -gencode arch=compute_53,code=sm_53 \ -gencode arch=compute_61,code=sm_61 \ -gencode arch=compute_70,code=compute_70
- 2、Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_INTERNA
rm -rf ~/.nv
- 驱动和软件不匹配
- 显存不足,可以减小batch_size
3.知识点
- 1、计算能力
CUDA SDK 8.0 support for compute capability 2.0 – 6.x (Fermi, Kepler, Maxwell, Pascal), last version with support for Compute Capability 2.x (Fermi)
CUDA SDK 7.5 support for compute capability 2.0 – 5.x (Fermi, Kepler, Maxwell)