SuperPoint学习训练纪录盘点各种报错解决方法（二）

企业开发 2022-07-31 19:22:31 阅读次数: 0

之前介绍了原版SuperPoint，可惜原版没有公开训练代码，接下来看一个复现版本。

为了成功运行这个版本，反复配置无数遍，建议大家就跟着我的方法来，一次就成功。

运行成功，cuda cudnn tensorflow-gpu 版本和之间的版本对应十分重要，配置有点不对，后面各种问题。

配置方法来源

1.配置虚拟安装环境

首先安装anaconda，用来配置虚拟环境，我用的3.5.3版本，我是系统是ubuntu18.04。

下载后终端命令安装（一路回车，yes，问到vscode，填no，安装完成。）

bash Anaconda3-5.3.0-Linux-x86_64.sh

安装完成后创造一个python=3.6的环境（3.7遇到tf1.12无法安装的错）

conda create --name superpoint python=3.6

2.开始superpoint环境配置

别用pip配TensorFlow 然后conda配cuda cudnn 那样版本都需要自己控制，非常容易出问题。用conda配TensorFlow，conda会适配cuda cudnn。

conda install tensorflow-gpu=1.12

安装完毕用查看一下配置

conda list

可以看见cuda cudnn都安装好了分别是10.0 和 7.6.5

由于已经安装了TensorFlow-gpu 则在编译源码前需要在requirement.txt中去掉TensorFlow-gpu

打开SuperPoint/requirement.txt 去掉第一行的TensorFlow==1.12

然后开始安装源码，在Superpont目录下。

make install

3.配置完毕盘点我遇到的小部分报错

Check failed: h != kInvalidChunkHandle TensorFlow版本问题 1.12改1.13。

load without loader yaml.load掉了参数改为config = yaml.load(f,Loader=yaml.FullLoader)

大概是input axle 0 200，shape must（50，150，0）调用两个以上gpu训练就会遇到，建议就两个来。

scores has incompatible shape tf cuda cudnn 之间的版本错误

Check failed: cusolverDnCreate(&cusolver_dn_handle) == CUSOLVER_STATUS_SUCCESS Failed to create cuSolverDN instance 终端运行export TF_FORCE_GPU_ALLOW_GROWTH=true

OP_REQUIRES failed at cholesky_op.cc:154 : Internal: tensorflow/core/kernels/cuda_solvers.cc:375: cuSolverDN call failed with status =7 tf cuda cudnn 之间的版本错误

猜你喜欢

转载自blog.csdn.net/weixin_48464886/article/details/120976621

SuperPoint学习训练纪录盘点各种报错解决方法（二）

SuperPoint学习训练纪录无训练版与带训练版本（一）

基于深度学习的特征提取系列（二）：SuperPoint 论文

YOLOv6训练时报错解决方法

PyTorch学习中遇到的各种问题（安装python，import出错，github下载速度慢的解决方法，from scipy.misc import imread 、import torch报错）

MAVEN学习(七)--maven报错与解决方法

[3D检测系列-PointRCNN]复现PointRCNN代码，并实现PointRCNN3D目标检测可视化，包含预训练权重下载链接（从0开始以及各种报错的解决方法）

深度学习模型训练痛点及解决方法

VUE学习遇到的问题及解决方法（二）

Idea下GPU训练时报错：cuDNN not found——解决方法

【AI实战】YOLOv7加载多GPU训练的模型报错解决方法

appium运行各种坑爹报错问题及解决方法

iOS 上传 App Store的各种报错解决方法

spark各种报错汇总以及解决方法

Sigma的个人训练纪录

使用opencv训练分类器时，traincascade训练报错：Train dataset for temp stage can not be filled.解决方法

记录学习元素定位法时出现的报错以及解决方法

Python3+Appium学习笔记05-报错及解决方法

Selenium 学习笔记，第一个例子就报错，解决方法

Caffe学习（一）：安装Windows版Caffe与Faster RCNN过程中的报错及解决方法

深度学习遇到报错Bug解决方法（不定时更新）

深度学习部署：Windows安装pycocotools报错解决方法

盘点ip地址冲突解决方法

【PyTorch教程】04-详解torchvision 0.13中的预训练模型加载的更新及报错的解决方法 (2022年最新)

带你深入AI（1） - 深度学习模型训练痛点及解决方法

深度学习训练过程耗时越来越长解决方法

python机器学习及实践第二章的2.1.2.1线性回归器程序报错Reshape your data either using array.reshap(-1,1)的原因及解决方法

学习多线程笔记二——使用多线程所面临的的问题及解决方法

Katalon Studio学习笔记(二)——请求响应中文乱码解决方法

Vue的学习--遇到的一些问题和解决方法（二）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)