MiniGPT4系列之三模型推理 (Web UI)：在RTX-3090 Ubuntu服务器推理 - 代码天地

MiniGPT4系列之三模型推理 (Web UI)：在RTX-3090 Ubuntu服务器推理

移动开发 2023-09-09 00:36:31 阅读次数: 0

MiniGPT4系列之一部署篇：在RTX-3090 Ubuntu服务器部署步骤详解_seaside2003的博客-CSDN博客

MiniGPT4系列之二推理篇：在RTX-3090 Ubuntu服务器推理详解_seaside2003的博客-CSDN博客

MiniGPT4系列之三模型推理 (Web UI)：在RTX-3090 Ubuntu服务器推理_seaside2003的博客-CSDN博客

启动控制器

切换到，FastChat目录下，执行以下命令：

python3 -m fastchat.serve.controller

虽然出现ERROR，但后面经验证毫无影响，不要担心。

启动model worker

新开一个窗口，执行以下命令，当进程完成模型的加载后，会看到「Uvicorn running on ...」，下面也有一些ERROR，无需理会：

python3 -m fastchat.serve.model_worker --model-name 'vicuna-7b-v1.1' --model-path /home/train/mycharm/new/vicuna

发送测试消息

再新开一个窗口，执行以下命令，出现一行字就结束了：

python3 -m fastchat.serve.test_message --model-name vicuna-7b-v1.1

启动gradio网络服务器

在此窗口内，执行以下命令，有些ERROR，不用管：

python3 -m fastchat.serve.gradio_web_server

端口映射

此时可以在服务器上访问这个地址就可以，但服务器通常没有界面，需要做个映射

再新开一个窗口，执行以下命令：

sudo iptables -t nat -A PREROUTING -p tcp --dport 8080 -j REDIRECT --to-port 7860

再执行：

sudo service iptables save

下面就是见证奇迹的时刻了，你可以打开浏览器和模型聊天了。可以在通过内网IP地址:端口号访问服务了，具体地址和端口号要根据自己的设置修改。

我的是：http://11.137.12.85:8080/

成功运行后界面如下图所示，可以正常对话了：

成功返回内容后，三个窗口响应请求的情况：

GPU资源消耗情况：

至此，已完成除训练外的所有工作，congratulations！

最后提一下，这个帖子，写的也还可以，可以参考：

LLM系列 | 02: Vicuna简介及模型部署实测-阿里云开发者社区

错误及解决办法：

在执行：python3 -m fastchat.serve.controller时出现以下错误：

ERROR:[Errno 98] error while attempting to bind on address ('127.0.0.1', 21001): address already in use

主要是端口占用，需要找到该端口对应的pid，kill掉即可

执行以下命令：

sudo netstat -tunlp

可以看出21001端口对应的pid为810758

执行以下命令：

sudo kill -9 810758

然后再次运行就会成功：

python3 -m fastchat.serve.controller

猜你喜欢

转载自blog.csdn.net/qq_18256855/article/details/131737450

MiniGPT4系列之三模型推理 (Web UI)：在RTX-3090 Ubuntu服务器推理

MiniGPT4系列之二推理篇命令行方式：在RTX-3090 Ubuntu服务器推理详解

MiniGPT4系列之一部署篇：在RTX-3090 Ubuntu服务器部署步骤详解

复杂推理模型从服务器移植到Web浏览器的理论和实战

DeepSpeed实战系列篇2：RTX 3090服务器Reward模型微调

DeepSpeed实战系列篇1：RTX 3090服务器部署及训练过程详解

Ubuntu 下实现FTP服务器，SSH服务器，邮件服务器，Web服务器（三）

4、WEB 与服务器

BEVFusion复现（Ubuntu RTX3090）

【故障诊断】【Ubuntu服务器】NVIDIA GeForce RTX 3090 with CUDA capability sm_86 is not compatible with the curre

nginx系列--做web服务器

web服务器系列_nginx实战

笔记4：WEB服务器

Flask Web Ubuntu服务器部署

Ubuntu Web服务器的搭建

Ubuntu 搭建web服务器

ubuntu web服务器配置

Triton推理服务器吞吐量测试

08.Web服务器-4.Web服务器动态资源请求

Ubuntu20.04+RTX3090复现PointRCNN记录

RTX 3090 Ti 正式发布！30系列显卡的封顶之作！

Ubuntu 下实现FTP服务器，SSH服务器，邮件服务器，Web服务器（四）

Ubuntu 下实现FTP服务器，SSH服务器，邮件服务器，Web服务器（一）

Ubuntu 下实现FTP服务器，SSH服务器，邮件服务器，Web服务器（二）

web服务器

web 服务器

Web服务器！

web半同步半异步模式的服务器模型

Web服务器处理并发连接请求的工作模型

【SpringBoot WEB 系列】SSE 服务器发送事件详解

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)