Triton推理服务器吞吐量测试

企业开发 2023-04-07 01:07:42 阅读次数: 0

文章目录

前言
安装测试环境
测试
总结

前言

性能分析器是优化模型性能的重要工具，决定如何在单个 GPU 上最好地运行多个模型。

安装测试环境

拉取镜像

docker pull nvcr.io/nvidia/tritonserver:22.08-py3-sdk

在这里插入图片描述

测试

启动测试环境

docker run -it --rm --net=host  -v/data/project/triton_deploy/models:/models -v/data/project/triton_deploy/plugins:/plugins nvcr.io/nvidia/tritonserver:22.08-py3-sdk

这里需要根据自己的路径修改models与plugins路径

在这里插入图片描述

对比同一模型不同并发数的吞吐量

perf_analyzer -m model_name --concurrency-range 1:4 --percentile=95 -i grpc

model_name为测试的模型名称
在这里插入图片描述

对比同一模型不同实例数的吞吐量

将instance_group [ { count: 4}]添加到模型配置的末尾文件，然后重新启动 Triton

perf_analyzer -m model_name --concurrency-range 1:4 --percentile=95 -i grpc

在这里插入图片描述
这里看起来好像与默认实例相比没什么变化，不知道是不是因为我用的是yolov5x模型的原因，不太清楚！

总结

除了启用模型实例，还是可以设置启用动态批处理器，这两项也可以同时启用，可以根据自己的配置进行设置比较。通过模型分析器部分介绍了一种工具，可帮助我们了解模型的GPU 内存利用率，以便决定如何在单个 GPU 上最好地运行多个模型。
参考文档：https://github.com/triton-inference-server/server/blob/main/docs/user_guide/optimization.md
如果阅读本文对你有用，欢迎一键三连呀！！！
2022年9月15日20:12:35
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/JulyLi2019/article/details/126878213

Triton推理服务器吞吐量测试

HTTP_Load测试web服务器的吞吐量和负载

测试阿里云1核2g轻量级服务器的吞吐量

性能测试---吞吐量

kafka吞吐量测试

单服务器单进程吞吐量优化总结

接入路由器吞吐量测试方法

7、spring boot + Maven + Restful 模拟异步处理Rest服务提高服务器吞吐量

性能测试原理 - 吞吐量解析

Glusterfs吞吐量性能测试

Wifi吞吐量测试，关于iperf

wifi吞吐量测试方法

RabbitMQ吞吐量测试-PerfTest上

CHARIOT测试网络吞吐量

iperf工具吞吐量测试

吞吐量测试与iPerf的使用

性能测试基础（四）吞吐量

如何提升springboot服务吞吐量

06 吞吐量收集器

网络相关基础知识总结（一）吞吐量测试&吞吐量与带宽区别

吞吐量

吞吐量计算

系统吞吐量

吞吐量图表.

throughput(吞吐量)

MySQL的吞吐量

吞吐量Throughout

【常数吞吐量控制器】-控制吞吐量指标的

Storm环境配置及吞吐量测试调优总结

Jmeter负载测试之固定吞吐量

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)