LlamaGPT -基于Llama 2的自托管类chatgpt聊天机器人 - 代码天地

LlamaGPT -基于Llama 2的自托管类chatgpt聊天机器人

企业开发 2023-08-19 18:45:14 阅读次数: 0

LlamaGPT一个自托管、离线、类似 ChatGPT 的聊天机器人，由 Llama 2 提供支持。100% 私密，不会有任何数据离开你的设备。

在这里插入图片描述

推荐：用 NSDT编辑器快速搭建可编程3D场景

1、如何安装LlamaGPT

LlamaGPT可以安装在任何x86或arm64系统上。

首先确保你已安装 Docker。然后，克隆此存储库并进入目录：

git clone https://github.com/getumbrel/llama-gpt.git
cd llama-gpt

现在可以使用以下任何模型运行 LlamaGPT，具体取决于你的硬件：

模型大小	使用的模型	所需的最低 RAM	如何启动 LlamaGPT
7B	Nous Hermes Llama 2 7B (GGML q4_0)	8GB	docker compose up -d
13B	Nous Hermes Llama 2 13B (GGML q4_0)	16GB	docker compose -f docker-compose-13b.yml up -d
70B	Meta Llama 2 70B Chat (GGML q4_0)	48GB	docker compose -f docker-compose-70b.yml up -d

可以通过 http://localhost:3000 访问 LlamaGPT。

要停止 LlamaGPT，请运行：

docker compose down

2、基准测试

我们在以下硬件上测试了 LlamaGPT 模型，并使用默认系统提示和用户提示：“宇宙如何膨胀？” 温度设置为 0 时保证确定性结果。生成速度是前 10 代的平均值。

Nous Hermes Llama 2 7B (GGML q4_0)

设备	生成速度
M1 Max MacBook Pro (10 64GB RAM)	8.2 令牌/秒
Umbrel Home (16GB RAM)	2.7 令牌/秒
Raspberry Pi 4 (8GB RAM)	0.9 令牌/秒

Nous Hermes Llama 2 13B (GGML q4_0)

设备	生成速度
M1 Max MacBook Pro (64GB RAM)	3.7 令牌/秒
Umbrel Home (16GB RAM)	1.5 令牌/秒

Meta Llama 2 70B 聊天 (GGML q4_0)

不幸的是，我们还没有这个模型的任何基准。

原文链接：LlamaGPT自托管chatbot — BimAnt

猜你喜欢

转载自blog.csdn.net/shebao3333/article/details/132384070

LlamaGPT -基于Llama 2的自托管类chatgpt聊天机器人

基于 Llama2 和 OpenVINO™ 打造聊天机器人

ChatDoctor：一个基于微调LLaMA模型用于医学领域的医学聊天机器人

基于Llama2和LangChain构建本地化定制化知识库AI聊天机器人

基于检索的聊天机器人

基于小程序制作一个ChatGPT聊天机器人

【Python】uiautomation+openai构建基于chatGPT的微信聊天机器人

基于ChatGPT的端到端语音聊天机器人项目实战（一）

搭建属于自己的基于ChatGPT的微信聊天机器人（方法）

Med-Flamingo 通过LLAMA 2进行多模式少样本学习的医疗聊天机器人

基于Llama2模型的开源模型

实现基于seq2seq的聊天机器人

基于Seq2Seq的问答系统/聊天机器人

python:基于wxpy微信聊天机器人

基于检索的聊天机器人的实现

基于Python QQBot库的QQ聊天机器人

智能聊天机器人——基于RASA搭建

新技术前沿-2023-ChatGPT基于人工智能技术的聊天机器人

Meta 开源基于 Llama 2 的 AI 代码生成大模型：Code Llama

Code Llama 是Meta 开源基于 Llama 2 的 AI 代码生成大模型

在实际应用中利用 Llama 2 功能：使用 FastAPI、Celery、Redis 和 Docker 构建可扩展的聊天机器人

聊天机器人-基于QQ聊天记录训练

AIGC：ColossalChat(基于LLM和RLHF技术的类似ChatGPT的聊天机器人)的简介、安装、使用方法之详细攻略

树莓派语音聊天机器人（基于讯飞语音和图灵机器人）

Python基于AIML智能聊天机器人实战（4）- 机器人自学习能力集成

微信智能机器人助手，基于hook技术，自动聊天机器人

Python全栈之路系列之基于socket实现聊天机器人

QQ聊天机器人--基于酷Q写的插件

使用 Encoder-Decoder 框架实现基于深度学习的聊天机器人

两种开源聊天机器人的性能测试（二）——基于tensorflow的chatbot

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)