深度学习模型部署推理整合教程1 - 代码天地

深度学习模型部署推理整合教程1

其他 2021-11-20 03:57:09 阅读次数: 0

这算是一个整合性得文章，主要记录下深度学习模型部署情况。

目前部署推理得框架较多，如opencv、tensorrt、openvino、onnxruntime、darknet，paddlepaddle、libtorch 用到的最多的应该是trt和openvino，接下来进行一一部署。

1、opencv

opencv作为一个开源的视觉库，想必大家都十分得了解了，再次不进行过多的解释，opencv部署深度学习框架主要是有dnn模块完成。

其中opencv部署也分cpu和gpu区别，其中GPU部署需要进行cmake编译，

接下来我们使用yolov3进行cpu部署：

cpu的部署723ms，这时间确实很长的了，gpu需要编译，选择gpu推理的时候将DNN_TARGET_CPU改为DNN_TARGET_CUDA即可 DNN_BACKEND_OPENCV改为DNN_BACKEND_CUDA

Net net = readNetFromDarknet(yolo_tiny_cfg, yolo_tiny_model);
	net.setPreferableBackend(DNN_BACKEND_OPENCV);
	net.setPreferableTarget(DNN_TARGET_CPU);
	std::vector<String> outNames = net.getUnconnectedOutLayersNames();
	for (int i = 0; i < outNames.size(); i++) {
		printf("output layer name : %s\n", outNames[i].c_str());
	}

opencv+cuda:卧槽了个DJ 。这么快的吗？？？？这特么的比trt还快。。。。yolov4。。。。

yolov4+enet分割网络：

yolov4作为目标检测网络，enet作为分割网络。（ennet是下载别人的。。。。。。）

添加了两个网络，，，，，，，检测还这么好？？？？？

2、tensorrt

这个主要是针对GPU部署推理，速度极快，大概10ms一张图

TensorRT7.0+yolov5+win10+VS2019_zhangdaoliang1的博客-CSDN博客

3、openvino

intel针对自家的cpu加速推理的框架，大家要是没有gpu，只能在cpu上部署的，建议采用openvino进行部署。

我使用的模型是fasterrcnn 大概500ms，fasterrcnn二阶段网络，这个时间确实有点长了，回头在试试v3吧

4、darknet

yolo系列的粉丝对darknet应该是非常熟悉的了，而且darknet也支持C++部署。

可以参考：

DarkNet+win10+编译dll+yolov3/yolov4_zhangdaoliang1的博客-CSDN博客

v3的速度大概是7帧每秒，但是确实使用了gpu加速，但是gpu的使用率并不高。

5、paddlepaddle

paddle是百度推出来，基于训练+部署一条龙服务，主要的好处在于文档比较详细，有问题直接与开发人员反应，而飞桨的部署也是基于飞桨自己的模型。之前也搞过很多飞桨的部署，详细的话可以看看我其他的博客。

基于paddlex训练的v3，编译的gpu版本，时间大概90ms，之前用官方的测试是30ms左右，不过我这个是没有进行裁剪与量化的，(计算的时间其实是将画线的时间都算进去了)，paddle的部署基本上都是基于C#的，对于喜欢用C#做界面的小伙伴可以去尝试下飞桨的部署。

6、onnxruntime

这个框架我接触的应该是最少的了，几乎没有用过，搞过最多的就是转.onnx格式，，最近用的一次是yolox的onnxruntime推理。

7、libtorch

libtorch是C++版本的pytorch,去官网下载对应的版本的libtorch

不过说实话这精度下降的确实有些明显。。。。。。

总结：

GPU下的部署那肯定是优先trt的部署，速度很快，

CPU下的部署优先openvino，

喜欢C#的可以考虑下飞桨的部署。

猜你喜欢

转载自blog.csdn.net/zhangdaoliang1/article/details/120524919

深度学习模型部署推理整合教程1

深度学习模型推理部署常用的框架总结记录

如何进行深度学习模型的部署和推理？

深度学习实践——模型推理优化练习

深度学习模型推理时间与FPS的求取方法，以及time，OpenCV的API教程

【模型部署】入门教程（七）：TensorRT 模型构建与推理

深度学习模型部署

深度学习实战——模型推理优化（模型压缩与加速）

深度学习之模型压缩、加速模型推理

【Pytorch基础教程38】torchserve模型部署和推理

如何给深度学习加速——模型压缩、推理加速

深度学习模型剪枝、量化和TensorRT推理

深度学习模型部署加密

TensorRT部署深度学习模型

深度学习之模型部署

使用TensorRT和Jetson TX1 / TX2部署深度学习推理网络和深度视觉原语的指南学习五

深度学习模型部署之模型优化

【深度学习】【部署】Flask快速部署深度学习模型【入门】

【深度】工程师必备—AI模型训练+推理优化+嵌入部署

win下C++部署深度学习模型之clion配置pytorch+opencv教程记录

深度学习模型部署全流程-模型部署

深度学习推理和训练

训练好的深度学习模型是怎么部署的？

深度学习模型部署与剪枝优化实例

基于C++的深度学习模型部署

基于web端的深度学习模型部署

深度学习_模型导出与部署（8）

深度学习模型部署资料总结

深度学习模型在移动设备的部署

使用DJL库部署深度学习模型

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

SVN同步出现问题

解决 nginx 出现 413 Request Entity Too Large 的问题

第一节区块链服务BaaS的总体架构以及基本模块设计的一种方案

ITeye 2013年度盘点——社区赠书书单

IDEA / git 和github 的新手使用教程史上最简单的 IntelliJ IDEA 教程史上最简单的 GitHub 教程

测试工程方法：测试用例设计综合策略

Spark优化(三)：对多次使用的RDD进行持久化

使用STM32 ST-LINK Utility 设置读保护后不能运行

exgcd 解同余方程ax=b(%n)

Android使用脚本进行多渠道打包

每日归档

更多

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)