TensorRT模型推理内存泄露问题解决 - 代码天地

TensorRT模型推理内存泄露问题解决

企业开发 2023-06-05 02:56:21 阅读次数: 0

问题描述：

在部署AI云服务后端时，使用tensorRT来进行模型推理，发现随着客户端不断地请求服务，显存会持续的增长，当累积到一定程度时就会出现申请不到显存而报错的情况。

经过分析是在tensorrt模型前向推理是造成的问题，在代码里：

trt_engine_path = './model/resnet50.trt'
trt_runtime = trt.Runtime(TRT_LOGGER)

engine = load_engine(trt_runtime, trt_engine_path)
context = engine.create_execution_context()
trt_outputs = do_inference(context, bindings=bindings, inputs=inputs, outputs=outputs, stream=stream)

解决办法：

使用with语句来加载engine和context，推理结束时会自动释放显卡内存，写法如下：

trt_engine_path = './model/resnet50.trt'
trt_runtime = trt.Runtime(TRT_LOGGER)

with load_engine(trt_runtime, trt_engine_path) as engine:
    inputs, outputs, bindings, stream = allocate_buffers(engine)

    with engine.create_execution_context() as context:
        trt_outputs = do_inference(context, bindings=bindings, inputs=inputs, outputs=outputs, stream=stream)
        ......

除此之外，大家可以多看看tensorrt里面自带的samples，里面有关于不同模型的tensorRT推理的写法。

猜你喜欢

转载自blog.csdn.net/u012505617/article/details/111543125

TensorRT模型推理内存泄露问题解决

问题解决：记录一次Java程序内存泄露的解决过程（proxool内存泄露）

iOS7 UIWebView内存泄露问题解决方法

在onnx推理onnxruntime出现警告问题解决

iOS内存警告问题解决

关于DB组件造成的内存泄露问题解析及解决

day100-缓存-缓存使用-压力测试出的内存泄露及解决（Lettuce低版本bug问题解决）

Flask部署TensorRT问题解决（pycuda._driver.LogicError: explicit_context_dependent failed）

【问题解决】同一机器上Flask部署TensorRT报错记录

TensorRT对TensorFlow模型进行推理

tensorRT 分类模型构建与推理

Jetson Nano 【14】Pytorch的YOLOv3 spp 模型中关于tensorRT+ 矩形推理问题的解决过程

spark内存泄露的问题及解决

解决echarts内存泄露的问题

tomcat内存溢出分析与问题解决

java 内存溢出问题解决方法

composer 执行内存超出问题解决

WKWebView中MessageHandler的内存泄漏问题解决过程

eclipse内存溢出问题解决

vue 内存溢出问题解决

kafka运行内存不足问题解决

redis内存占用过大问题解决

MyEclipse内存溢出问题解决方法

composer内存溢出问题解决

Linux | Linux内存用量查询及问题解决

问题解决

【问题解决】发现Web应用程序源代码泄露模式

使用Android Studio检测内存泄露与解决内存泄露问题

caffe模型预测及其问题解决

Pytorch学习（十七）--- 模型load各种问题解决

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)