用CenterNet做3D检测,效果demo

一、准备

1、环境:win10 x64, pytorch 1.7+python3.7虚拟环境,cuda10.1 update2,GTX1060

2、centernet官方代码:https://github.com/xingyizhou/CenterNet

3、DCNv2最新版本(支持pytorch1.5-1.7):https://github.com/lbin/DCNv2/tree/pytorch_1.7

4、下载官方预训练模型:ddd_3dop(在KITTI上训练) 

所有modelzoo里的模型都已传到百度网盘,链接如下:

链接:https://pan.baidu.com/s/15U9xsktMhvshAuG37B8V0Q 
提取码:6x9e

需提前编译好DCNv2,结果如下图:

 编译过程看另一篇博客:https://blog.csdn.net/sinat_33486980/article/details/118595986

二、运行demo

首先配置下demo的任务:ddd表示3D检测,ctdet表示2D目标检测,再配置网络结构:dla_34,测试数据路径(可以是一个视频文件或一个图片文件夹),预训练模型路径:ddd_3dop.pth

运行,可能会遇到报错的地方是cvline画3D框的地方,需要把传入的每个坐标参数转成int型,而原来传的都是float型。修改完应该就可以成功运行,我这里从KITTI的测试数据集中国拿了1000张,检测结果如下(左边是鸟瞰图,右边是显示3D检测框的图):

 

再测试下道路摄像头监控场景下的检测:

 

在KITTI数据集上效果也没有想象中那么惊艳的效果,但是centernet的思路确实是值得借鉴的 

猜你喜欢

转载自blog.csdn.net/sinat_33486980/article/details/118600983
今日推荐