记录TritonServer部署多模型到多GPU踩坑 | 京东云技术团队 - 代码天地

记录TritonServer部署多模型到多GPU踩坑 | 京东云技术团队

其他 2023-10-18 17:19:06 阅读次数: 0

【源创会预告】1024 程序员节（的前两天），相约开源中国办公室，我们一起聊 AI！>>>

一、问题是怎么发现的

部署chatglm2和llama2到一个4*V100的GPU机器上遇到问题

config.pbtxt

中设置模型分别在指定gpu上部署实例配置不生效

如以下配置为在gpu0上部署本模型,部署count=1个实例,在gpu1上部署本模型,部署count=2个实例

instance_group [ { count: 1 kind: KIND_GPU gpus: [ 0 ] },

{ count: 2

kind: KIND_GPU

gpus: [ 1 ] } ]

部署时发现,所有模型实例都会被部署到gpu0上面, 由于gpu只有16g显存,在部署第一个模型实例成功后,第二个模型实例也会往gpu0上进行加载,最终导致cuda out of memery.

网上搜索发现有人遇到同样的问题,链接: https://github.com/triton-inference-server/server/issues/6124

二、排查问题的详细过程

大佬回答解决方案:

三、如何解决问题

1.在model.py手动获取config.pbtxt配置的gpu编号gpus:[0]

instance_group [

{

count: 1

kind: KIND_GPU

gpus: [ 0 ]

}

]

2.设置可用的GPU编号

os.environ["CUDA_VISIBLE_DEVICES"] = str(device_id)

3.启动成功

四、总结反思:是否可以更快发现问题?如何再次避免等。

triton启动的使用使用 nvidia-smi -l 2 监控显卡想显存, 可以发现所有模型都在往第一个gpu,gpu[0]内加载,发现配置config.pbtxt不生效

作者：京东科技杨建

来源：京东云开发者社区转载请注明来源

{{o.name}}

{{m.name}}

猜你喜欢

转载自my.oschina.net/u/4090830/blog/10119736

记录TritonServer部署多模型到多GPU踩坑 | 京东云技术团队

小小的日志，大大的坑 | 京东云技术团队

DeepSpeed：大模型训练框架 | 京东云技术团队

从TL、ITL到TTL | 京东云技术团队

springboot升级过程中踩坑定位分析记录 | 京东云技术团队

百亿规模京东实时浏览记录系统的设计与实现 | 京东云技术团队

研发日常踩坑-Mysql分页数据重复 | 京东云技术团队

行云部署成长之路--慢SQL优化之旅 | 京东云技术团队

从积木式到装配式云原生安全 | 京东云技术团队

服装行业多模态算法个性化产品定制方案 | 京东云技术团队

使用Triton部署chatglm2-6b模型 | 京东云技术团队

浅谈Mysql读写分离的坑以及应对的方案 | 京东云技术团队

一次元数据空间内存溢出的排查记录 | 京东云技术团队

领域建模之数据模型设计方法论 | 京东云技术团队

DDD项目落地之充血模型实践 | 京东云技术团队

架构师日记-从代码到设计的性能优化指南 | 京东云技术团队

从0到1搭建自己的脚手架（java后端） | 京东云技术团队

从0到1构造自定义限流组件 | 京东云技术团队

聊聊JDK1.0到JDK20的那些事儿 | 京东云技术团队

GPT大语言模型Vicuna本地化部署实践（效果秒杀Alpaca） | 京东云技术团队

chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队

玩转服务器之环境篇：PHP和Python环境部署指南 | 京东云技术团队

一份保姆级的Stable Diffusion部署教程，开启你的炼丹之路 | 京东云技术团队

保姆教程 | 用GPU云主机搭建AI大语言模型并用Flask封装成API，实现用户与模型对话 | 京东云技术团队

如何进行测试分析与设计-HTSM启发式测试策略模型 | 京东云技术团队

常用语言的线程模型（Java、go、C++、python3） | 京东云技术团队

浅析MySQL代价模型：告别盲目使用EXPLAIN，提前预知索引优化策略 | 京东云技术团队

多模态GPT-V出世！36种场景分析ChatGPT Vision能力，LMM将全面替代大语言模型？ | 京东云技术团队

GPT大语言模型Alpaca-lora本地化部署实践【大语言模型实践一】 | 京东云技术团队

从TL、ITL到TTL | 京东物流技术团队

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)