TensorRT笔记(14)部署TensorRT优化模型

其他 2021-02-14 14:23:35 阅读次数: 0

部署TensorRT优化模型

13.部署TensorRT优化模型
- 13.1 云端部署
- 13.2 部署到嵌入式系统

13.部署TensorRT优化模型

创建包含优化推理模型的计划文件后，可以将该文件部署到生产环境中。如何创建和部署计划文件将取决于您的环境。例如，您可能对模型具有专用的推理可执行文件，该可执行文件可加载计划文件，然后使用NVIDIA®TensorRT™Execution API将输入传递给模型，执行模型以进行推理，最后读取模型的输出。
本节讨论如何在某些常见的部署环境中部署TensorRT。

13.1 云端部署

一种常见的用于推理的云部署策略是通过服务器实现模型，该服务器为模型实现HTTP REST或gRPC端点。然后，远程客户端可以通过向该端点发送格式正确的请求来执行推理。该请求将选择一个模型，提供该模型所需的必要输入张量值，并指出应计算哪些模型输出。
要在此部署策略中利用TensorRT优化的模型，不需要进行任何根本性的更改。必须更新推理服务器以接受由TensorRT计划文件表示的模型，并且必须使用TensorRT执行API加载和执行那些计划。可以在《 NVIDIA Triton推理服务器容器发行说明》和

猜你喜欢

转载自blog.csdn.net/qq_33287871/article/details/113803859

TensorRT笔记(14)部署TensorRT优化模型

深度学习模型部署TensorRT加速（三）： TensorRT模型部署及优化

深度学习模型部署TensorRT加速（十）：TensorRT部署分析与优化方案（一）

深度学习模型部署TensorRT加速（十一）：TensorRT部署分析与优化方案（二）

TensorRT部署深度学习模型

TensorRT优化

【TensorRT】TensorRT 部署Yolov5模型（C++）

pytorch模型转TensorRT模型部署

Tensorrt笔记

Pytorch模型部署之--------TensorRT介绍

Pytorch模型通过TensorRT部署推理---HRNet

TensorRT（C++）部署 Pytorch模型

深度学习模型C++部署TensorRT

ubuntu下yolox tensorrt模型部署

TensorRT

TensorRT笔记(一)TensorRT简介

Tensorrt笔记（四）推理分割模型

深度学习模型部署TensorRT加速（七）：TensorRT部署图像分类模型

深度学习模型部署TensorRT加速（六）：TensorRT部署自定义CNN模型

深度学习模型部署TensorRT加速（五）：TensorRT部署流程及基本使用

深度学习模型部署TensorRT加速（四）：TensorRT的应用场景及部署模块应用

【部署】TensorRT（二）TensorRT的C++接口

Pytorch模型转TensorRT模型部署（一.环境的搭建）

【模型部署】入门教程（七）：TensorRT 模型构建与推理

【模型部署】c++调用tensorRT的模型（engine）

使用Python部署TensorRT

fasterrcnn tensorrt部署实践

TensorRT+Yolov7x:基于TensorRT+API部署YoloV7x模型

TensorRT+Yolov7:基于TensorRT+API部署YoloV7模型

TensorRT+Yolov7-tiny:基于TensorRT+API部署YoloV7-tiny模型

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)