ONNX部署

企业开发 2023-06-19 12:36:21 阅读次数: 0

在这里插入图片描述

trace和script

pytorch是动态计算图，tensorflow和onnx是静态计算图。动态图编写代码简单易懂，但速度慢。

pytorch转换为静态计算图，有两种方法torch.jit.trace和torch.jit.script。
torch.jit.trace：顾名思义跟踪，给定模型一个输入（只要求输入的shape正确），开始执行一次前向传播，会记录过程中的所有操作。缺点是race将不会捕获根据输入数据而改变的行为。比如if语句，只会记录执行的那一条分支，同样的，for循环的次数，导出与跟踪运行完全相同的静态图。如果要使用动态控制流导出模型，则需要使用torch.jit.script。
torch.jit.script：真正的去编译，去做语法分析句法分析。因此可以使用if等动态控制流。返回ScriptModule。
torch.onnx.export在运行时，先判断是否是SriptModule，如果不是，则进行torch.jit.trace，因此export需要一个随机生成的输入参数。

1. onnxruntime-gpu与CUDA版本适配

pip install onnxruntime-gpu==1.1 -i  https://pypi.tuna.tsinghua.edu.cn/simple

CUDA - onnxruntime
在这里插入图片描述

2. onnxruntime-gpu的c++接口报错未加载kernelbase.pdb

由于onnxruntime-gpu的版本问题

3.python接口onnx的推理比pb慢

在这里插入图片描述

4.Polygraphy查看ONNX与TRT模型的输出差异

Polygraphy是TensorRT官方提供的一系列小工具合集，通过这个工具我们看一下这个Resnet34_3inputs_448x448_20200609.onnx模型在转换为trt之后是否会有精度折损

5.onnx simplier（简称 onnxsim）

pip install onnx-simplifier -i https://pypi.douban.com/simple/

把conv和bn合在一块，以及一些计算出来是常量的模块直接折叠之类的，可以加快onnx模型推理。

6.onnx export RuntimeError: Unrecognized attribute: min for operator Clip

pytorch 升级到1.6

猜你喜欢

转载自blog.csdn.net/weixin_42809268/article/details/125769882

ONNX部署

onnx部署记录

ONNX简易部署教程

使用OpenVINO部署ONNX模型

tf serving部署 pytorch onnx

模型部署——CenterPoint转ONNX(自定义onnx算子)

onnx

c# 部署onnx定位模型

c# 部署onnx分类模型

【使用TensorRT通过ONNX部署Pytorch项目】

PyTorch模型部署流程(ONNX Runtime)

使用onnx和onnxruntime完成模型部署

【深度学习】ONNX模型快速部署【入门】

YoloV6+TensorRT+ONNX:基于WIN10+TensorRT8+YoloV6+ONNX的部署

ONNX+TensorRT:将预处理操作写入ONNX并完成TRT部署

使用ONNX部署深度学习和传统机器学习模型

深度学习模型PyTorch训练并转ONNX与TensorRT部署

模型部署翻车记：pytorch转onnx踩坑实录

pytorch 39 yolov5_obb的onnx部署及其优化

【模型部署】入门教程（五）：ONNX 模型的修改与调试

【模型部署】入门教程（三）：PyTorch 转 ONNX 详解

ONNX模型转TRT部署推理c++

tensorRT部署之代码实现 onnx转engine/trt模型

yolov8 ONNX Runtime C++ 部署

yolov8 实例分割 onnx runtime C++部署

Paddle2.0：ONNX模型的导出和部署

YOLO V5 ONNX模型在C# 中部署

AI模型部署落地综述（ONNX/NCNN/TensorRT等）

【深度学习】ONNX模型多线程快速部署【基础】

ONNX+TensorRT+YoloV5:基于trt+onnx得yolov5部署1

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)