使用onnxruntime-gpu 模型推理 - 代码天地

使用onnxruntime-gpu 模型推理

企业开发 2023-06-05 02:53:36 阅读次数: 0

1.安装onnxruntime-gpu

新版的onnxruntime-gpu 即支持gpu的推理，也支持cpu的推理。

卸载旧的1.7.1 cpu版本，安装新的gpu版本：

pip uninstall onnxruntime
pip install onnxruntime-gpu

检查是否安装成功：

>>> import onnxruntime
>>> onnxruntime.__version__
'1.10.0'
>>> onnxruntime.get_device()
'GPU'
>>> onnxruntime.get_available_providers()
['TensorrtExecutionProvider', 'CUDAExecutionProvider', 'CPUExecutionProvider']

2.修改推理代码

在推理代码上增加 providers参数，选择推理的框架。看自己支持哪个就选择自己支持的就可以了。

session = onnxruntime.InferenceSession('yolov5s.onnx', None)
# 改为：
session = onnxruntime.InferenceSession('yolov5s.onnx', 
        providers=['TensorrtExecutionProvider', 'CUDAExecutionProvider', 'CPUExecutionProvider'])

如果运行推理代码出现 Tensorrt, CUDA都无法推理，如下所示，则是自己的 ONNX Runtime, TensorRT, CUDA 版本没对应正确。

2022-08-09 15:38:31.386436528 [W:onnxruntime:Default, onnxruntime_pybind_state.cc:509 CreateExecutionProviderInstance] Failed to create TensorrtExecutionProvider. Please reference https://onnxruntime.ai/docs/execution-providers/TensorRT-ExecutionProvider.html#requirements to ensure all dependencies are met.

对应版本如下：

猜你喜欢

转载自blog.csdn.net/u012505617/article/details/126249243

使用onnxruntime-gpu 模型推理

【环境搭建：onnx模型部署】onnxruntime-gpu安装与测试（python）

onnx onnxruntime onnxruntime-gpu

ONNX模型转换与onnxruntime推理

yolov7模型部署——环境搭建(python 导出onnx模型，c# OnnxRunTime-GPU版调用) 踩坑记录

【模型推理】使用onnx进行推理

【模型推理】谈谈 GPU 并行推理的几个方式

基于spark on yarn with gpu的AI模型推理

基于spark on yarn with gpu的AI模型推理

pytorch gpu推理、onnxruntime gpu推理、tensorrt gpu推理比较，及安装教程，有详细代码解释

Python中使用改进U-Net分割模型测试paddle框架、onnxruntime与TensorRT的推理速度

6.7.tensorRT高级(1)-使用onnxruntime进行onnx模型推理过程

run onnx model with tf-backend and onnxruntime-gpu

【onnxruntime】onnx模型推理imagenet数据集验证精度

【模型推理】ubuntu 配置和使用 openvino

使用TensorRT加速Pytorch模型推理

paddleocr-推理模型使用

AI模型推理（３）——ModelMesh使用

AI模型推理（２）—— Kserve入门使用

使用tensorrt为模型推理加速

【TRT】使用TensorRT进行分类模型推理

PyTorch多GPU训练模型——使用单GPU或CPU进行推理的方法

使用指定编号的GPU进行模型的训练和推理,并且用gpustat进行监控显存

推理实践丨如何使用MindStudio进行Pytorch模型离线推理

腾讯云服务器部署onnxruntime-gpu经验总结

jetson-tx2装机、pytorch、yolov5、opencv-python、onnxruntime-gpu

分割一切模型 Fast SAM C++推理部署---onnxruntime（有核心代码）

RepVGG：使用自己的数据集进行训练、模型转换、推理

【OpenVino CPU模型加速（二）】使用openvino加速推理

C++使用onnxruntimeopencv对onnx模型进行推理(附代码)

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)