pytorch 38 对tensorRT、openvino、onnxruntime（fp32、fp16）推理速度进行对比 - 代码天地

pytorch 38 对tensorRT、openvino、onnxruntime（fp32、fp16）推理速度进行对比

企业开发 2023-05-04 15:15:32 阅读次数: 0

tensorRT与openvino部署模型有必要么？本博文对tensorRT、openvino、onnxruntime推理速度进行对比，分别在vgg16、resnet50、efficientnet_b1和cspdarknet53四个模型进行进行实验，对于openvino和onnxruntime还进行了cpu下的推理对比。对比囊括了fp32、fp16两种情况。在float32下通过实验得出：openvino GPU < onnxruntime CPU << openvino CPU < onnxruntime GPU <= tensorRT GPU。
得出结论：
1、在cpu上因该使用openvino部署，加速效果明显。
2、在gpu上可以适当考虑tensorRT部署，有一定加速效果（对于计算密集的模型加速效果明显）；

在fp16下测试，情况与fp32差异较大。速度排序为： onnxruntime CPU < openvino CPU <= openvino GPU < onnxruntime GPU < tensorR GPU。
可以看出在fp16下，onnxruntime完全没有加速效果;openvino有轻微加速效果，比onnxruntime CPU要强；而tensorRT加速效果明显，相比于float32速度提升了1/3~2/5。

并进行显存占用对比实验，实验数据如下,
fp32下vgg占用590M，resnet50占用162M，efficientnet_b1占用130M，cspdarknet53占用238M；
fp16下vgg占用374M，resnet50占用92M，efficientnet_b1占用68M，cspdarknet53占用156M

猜你喜欢

转载自blog.csdn.net/a486259/article/details/130207009

pytorch 38 对tensorRT、openvino、onnxruntime（fp32、fp16）推理速度进行对比

【Pytorch基础教程38】torchserve模型部署和推理

TensorRT--用fp16精度运行比 fp32还慢？

pytorch 前向传播与反向传播代码+ fp16

fp16与fp32简介与试验

FP32、FP16 和 INT8

Nvidia GPU的浮点计算能力(FP64/FP32/FP16)

深度学习技巧应用17-pytorch框架下模型int8,fp32量化技巧

38）

(38)

38

深度学习中的数据类型介绍：FP32, FP16, TF32, BF16, Int16, Int8 ...

CUDA FP16

pytorch gpu推理、onnxruntime gpu推理、tensorrt gpu推理比较，及安装教程，有详细代码解释

TensorRT下FP32转INT8的过程

【Pytorch神经网络实战案例】38神经网络实现估计互信息的功能

【Pytorch神经网络理论篇】 38 Transformers：安装说明+应用结构+AutoModel类

ONNXRuntime与PyTorch哪个更快？

基于TensorRT和onnxruntime下pytorch的Bert模型加速对比实践

Pytorch模型通过TensorRT部署推理---HRNet

使用TensorRT加速Pytorch模型推理

使用PyAudio-0.2.11-cp38-cp38-win32.whl，依旧显示没有包

pytorch ONNX and then to Tensorrt

IEEE754 FP16

pytorch mseloss bceloss 对比

对比Tensorflow与PyTorch的异同

TensorFlow与PyTorch对比

Tensorflow 对比pytorch

Numpy与pytorch对比记忆

pytorch与tf对比

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)