解决yolov5使用onnxruntime推理时耗时问题（cpu环境） - 代码天地

解决yolov5使用onnxruntime推理时耗时问题（cpu环境）

其他 2021-12-13 23:56:14 阅读次数: 0

yolov5将训练好的模型（yolov5s.pt）转换成onnx格式，在使用转换后的onnx格式的权重进行推理时作者使用如下语句：

# Inference
        if pt:
            visualize = increment_path(save_dir / Path(path).stem, mkdir=True) if visualize else False
            pred = model(img, augment=augment, visualize=visualize)[0]
        elif onnx:
            if dnn:
                net.setInput(img)
                pred = torch.tensor(net.forward())
            else:
                pred = torch.tensor(session.run([session.get_outputs()[0].name], {session.get_inputs()[0].name: img}))
        else:  # tensorflow model (tflite, pb, saved_model)

使用onnx权重模型时进到

pred = torch.tensor(session.run([session.get_outputs()[0].name], {session.get_inputs()[0].name: img}))

运行时，检测一张图片需要花费160-180ms

此时将上述语句替换成如下：

# Inference
        if pt:
            visualize = increment_path(save_dir / Path(path).stem, mkdir=True) if visualize else False
            pred = model(img, augment=augment, visualize=visualize)[0]
        elif onnx:
            if dnn:
                net.setInput(img)
                pred = torch.tensor(net.forward())
            else:
                # pred = torch.tensor(session.run([session.get_outputs()[0].name], {session.get_inputs()[0].name: img}))
                pred = np.array(session.run([session.get_outputs()[0].name], {session.get_inputs()[0].name: img}))
                pred = torch.from_numpy(pred)
        else:  # tensorflow model (tflite, pb, saved_model)

此时运行后，检测同一张图片的耗时减少为80-90ms，时间减少了一半。

猜你喜欢

转载自blog.csdn.net/athrunsunny/article/details/121241315

解决yolov5使用onnxruntime推理时耗时问题（cpu环境）

Yolov5在ONNXRuntime上的推理实现

YOLOv5在C++中通过Onnxruntime在window平台上的cpu与gpu推理

yolov5 onnxruntime c++在linux平台上GPU推理环境搭建整体流程

yolov5 C++推理（libtorch和onnxruntime框架）

yolov5 onnxruntime部署

yolov5使用onnxruntime进行c++部署

Yolov5 转 ONNX模型 + 使用ONNX Runtime的 C++ 部署（包含官方文档的介绍以及使用不同推理引擎作为ONNXRuntime后端）

使用YOLOv5检测大宽高比（细长目标）时无法检测问题的解决方法

yolov5 ncnn 推理

Yolov5 矩形推理

【Bug解决】YOLOv5 5.0 加载 6.0+版本的模型推理的兼容性问题

【深入YoloV5（开源）】基于YoloV5的模型优化技术与使用OpenVINO推理实现

yolov5使用opnecv进行c++推理部署

YOLOv5-推理时使用GPU

使用c++onnxruntime部署yolov5模型并使用CUDA加速（超详细）

YOLOv5：TensorRT加速YOLOv5模型推理

Yolov5对本地视频进行推理时，实现跳帧检测，提高推理效率

yolov5（cpu）配置

yolov5 opencv DNN 推理

YOLOV5模型转onnx并推理

Yolov5 最简推理代码

简化YOLOv5的推理过程

解决YOLOV5训练时P、R、mAP等值均为0的问题

配置yolov5环境时解决Command “python setup.py egg_info“ failed with error code 1 in xxx的问题

yolov5训练模型时遇到nan的问题

香橙派5使用NPU加速yolov5的实时视频推理（二）

香橙派5使用NPU加速yolov5的实时视频推理（一）

（Yolov5常见bug）RuntimeError: “slow_conv2d_cpu“ not implemented for ‘Half‘问题解决

YOLOv5 环境安装

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)