设置开源LLM模型用于本地开发 - 代码天地

设置开源LLM模型用于本地开发

企业开发 2023-10-02 17:37:18 阅读次数: 0

尽管 ChatGPT 仍然很受欢迎，但泄露的 Google 内部文件表明开源社区正在迎头赶上并取得重大突破。我们现在能够在消费级 GPU 上运行大型 LLM 模型。

因此，如果您是一名开发人员，想要在本地环境中尝试这些 LLM 并用它构建一些应用程序，那么在本文中我将演练一些可以帮助您的选项。

第一个选项：

https://github.com/oobabooga/text-generation-webui?source=post_page-----dcbf80c8d818--------------------------------

Gradio Web UI 可用于运行几乎所有可用的法学硕士。它支持不同格式的LLM，例如GGML或GPTQ。

第二个选项：

https://github.com/ggerganov/llama.cpp?source=post_page-----dcbf80c8d818--------------------------------

基于 AC/C++ 的库，专注于仅在 CPU 上运行 LLM 推理，但最近还添加了对 GPU 加速的支持。它被设计为一个独立的库，因此如果您想构建一个与其集成的应用程序，您可能必须构建自己的绑定或使用社区绑定库：

注意：对于 llama-cpp-python，如果您使用的是 Apple Silicon (M1) Mac，请确保您已安装支持 arm64 架构的 Python 版本。否则，安装时将构建 llama.ccp x86 版本，该版本在 Apple Silicon (M1) Mac 上速度会慢 10 倍。

第三种选择：

如果您有一个不错的 GPU，VRAM 大于 8GB，您可以选择对 GPU 使用 GPTQ 量化，例如GPTQ-for-LLaMa。

然而，GPTQ-for-LLaMa 仅提供了类似 CLI 的示例和有限的文档。因此，我创建了一个示例存储库，它使用 GPTQ-for-LLaMa 实现并通过 HTTP API 提供生成的文本。

https://github.com/mzbac/GPTQ-for-LLaMa-API?source=post_page-----dcbf80c8d818--------------------------------

总之，无论是 Gradio Web UI、llama.cpp 还是 GPTQ-for-LLaMa，每个选项都满足本地运行 LLM 的不同硬件功能。根据您的硬件资源进行选择。潜入法学硕士的激动人心的世界，祝你编码愉快！

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/133479317

设置开源LLM模型用于本地开发

LLM大模型应用开发的本地环境搭建

ChatIE（LLM大模型用于信息抽取）

ChatDoctor（LLM大模型用于医疗对话）

BloombergGPT（LLM大模型用于金融科技）

开源大型语言模型(llm)总结

Chat-REC（LLM大模型用于推荐系统）

HyDE、UDAPDR（LLM大模型用于信息检索）

大模型应用开发框架【LLM】

基于大模型（LLM）的Agent 应用开发

用于 LLM 应用开发的 LangChain 中文版

开源LLM大模型微调简明教程

ChatGPT中文LLM相关的开源大模型资源汇总

如何用更小的开源模型击败专有 LLM

MLC LLM - 大模型本地部署解决方案

LocalAI - 兼容OpenAI API的本地大模型技术栈【LLM】

开源LLM微调训练指南：如何打造属于自己的LLM模型

laravel 本地作用于模型查询

开源AI聊天机器人MLC LLM发布可用于多个平台

Llama 2：新一代开源LLM，可用于研究和商业用途

本地开发Mock设置

开源开放 | 开源知识图谱抽取工具发布大模型版DeepKE-LLM

使用全套开源工具构建 LLM 应用实战：在 Dify 调用 Baichuan 开源模型能力

LangChain大型语言模型(LLM)应用开发(三)：Chains

LangChain大型语言模型(LLM)应用开发(二)：Conversation & Memory

[AI医学] llm-medical-data:用于大模型微调训练的医疗数据集

Databricks 开源 LLM AI

开源LLM的创建步骤

类ChatGPT的各种语言大模型LLM开源Github模型集合

composer require 本地包（用于开发使用）

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)