利用uvicorn、Starlette和pipeline将一个训练好的大模型发布成一个web服务 - 代码天地

利用uvicorn、Starlette和pipeline将一个训练好的大模型发布成一个web服务

企业开发 2023-09-30 00:35:51 阅读次数: 0

技术名词：

1、Starlette：

它是一个轻量级、高度可用性和可扩展性的Web框架，它专门为异步应用程序设计。 Starlette基于Python 3.6+的异步/协程语法，具有快速响应性能和低延迟。你可以将它理解为Java的Spring。

安装：pip install starlette

2、uvicorn

它是一个Python Web服务器，用于实现基于ASGI（异步服务器网关接口）的异步Web应用程序。它是用Python编写的，可高效、高性能地处理HTTP请求和响应，而且很容易配置和部署。你可以将它理解为Java的Tomcat。

安装：pip install uvicorn

编写一个web服务server.py：

from starlette.applications import Starlette
from starlette.responses import JSONResponse
from starlette.routing import Route
from transformers import pipeline
from transformers import AutoModelForSequenceClassification, AutoTokenizer
import asyncio

async def homepage(request):
    payload = await request.body()
    string = payload.decode("utf-8")
    response_q = asyncio.Queue()
    await request.app.model_queue.put((string, response_q))
    output = await response_q.get()
    return JSONResponse(output)

async def server_loop(q):
    model_name = "/data/checkpoint-10598"
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    tokenizer.deprecation_warnings["Asking-to-pad-a-fast-tokenizer"] = True
    model = AutoModelForSequenceClassification.from_pretrained(model_name, num_labels=4)
    pipe = pipeline("text-classification", model=model, tokenizer=tokenizer)
    while True:
        (string, response_q) = await q.get()
        out = pipe(string)
        await response_q.put(out)

app = Starlette(
    routes=[
        Route("/", homepage, methods=["POST"]),
    ],
)

@app.on_event("startup")
async def startup_event():
    q = asyncio.Queue()
    app.model_queue = q
    asyncio.create_task(server_loop(q))

启动服务：

uvicorn server:app --port 8000

测试：

[ipa@comm]$ curl -X POST -d "我爱你" http://127.0.0.1:6788

结果：

[{"label":"LABEL_3","score":0.8000535368919373}]

总结：

利用transformers的pipeline来搭建一个Python的web服务，这样我们微调的大模型就能很简单的发布给他人使用，非常的方便便捷。

当然这个样例程序还有需要待完善的地方，你觉得该如何完善？

猜你喜欢

转载自blog.csdn.net/duzm200542901104/article/details/133362517

利用uvicorn、Starlette和pipeline将一个训练好的大模型发布成一个web服务

如何利用Keras训练好的.h5模型来测试一个实例

keras使用已训练好的模型作为其他模型的一个layer

大模型：如何利用旧的tokenizer训练出一个新的来？

利用Jcoder发布一个分词服务

训练一个专门捣乱的模型

如何训练一个语言模型？

利用JDK和tomcat发布一个上线项目

Unity中利用代码将物体摆放成一个圆圈的形状

从零开始编写一个宠物识别系统（爬虫、模型训练和调优、模型部署、Web服务）

PyTorch——应用一个已训练好的图片分类网络——AlexNet

在网络最后加一个训练好的mlp层并将其参数冻结

利用keras框架搭建一个简单CGAN模型，制作一个数据集用作训练

零基础，零成本，部署一个属于你的大模型

大模型“幻觉”无解？图技术成下一个突破口

将数据写出成一个灰度png图片

Python将list列表维护成一个栈

Spring整和CXF发布一个webservice服务

将springmvc配置成一个REST服务器的过程

一个Dubbo服务是如何发布的

mysql 如何将一个结果嵌套成一个表

Python 写一个Web服务

一个简易web服务原理

[多图，秒懂]如何训练一个“万亿大模型”？

如何在自己电脑上开发训练一个专业的大语言模型ChatGPT

从零开始训练一个GPT大语言模型

利用训练数据建立一个简单的分类器

Python 将采用 12 个月的发布周期：一年发布一个大版本

【主机渗透】利用python开启http服务，提供一个本地文件浏览的web服务

4-4如何将多个小字符串拼接成一个大的字符串

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)