Chinese-LLaMA-Alpaca我应该选什么模型？ - 代码天地

Chinese-LLaMA-Alpaca我应该选什么模型？

业界资讯 2023-07-19 00:55:44 阅读次数: 0

以下给出了中文LLaMA和Alpaca模型的基本对比以及建议使用场景（包括但不限于）。

对比项	中文LLaMA	中文Alpaca
训练方式	传统CLM （在通用语料上训练）	指令精调（在指令数据上训练）
输入模板	不需要	需要符合模板要求（llama.cpp/LlamaChat/inference_hf.py等已内嵌）
适用场景	文本续写：给定上文，让模型继续写下去	1、指令理解（问答、写作、建议等） 2、多轮上下文理解（聊天等）
不适用场景	指令理解、多轮聊天等	文本无限制自由生成
llama.cpp	使用`-p`参数指定上文	使用`-ins`参数启动指令理解+聊天模式
text-generation-webui	不适合chat模式	使用`--cpu`可在无显卡形式下运行，若生成内容不满意，建议修改prompt
LlamaChat	加载模型时选择"LLaMA"	加载模型时选择"Alpaca"
inference_hf.py	无需添加额外启动参数	启动时添加参数 `--with_prompt`
已知问题	如果不控制终止，则会一直写下去，直到达到输出长度上限。	目前版本模型生成的文本长度相对短一些，比较惜字如金。

如果出现了模型回答质量低、胡言乱语、不理解问题等情况，请检查是否针对场景使用了正确的模型和正确的启动参数

猜你喜欢

转载自blog.csdn.net/sinat_37574187/article/details/131735145

Chinese-LLaMA-Alpaca我应该选什么模型？

Chinese-LLaMA-Alpaca代码实战

NLP-分词器：SentencePiece【参考Chinese-LLaMA-Alpaca在通用中文语料上训练的20K中文词表并与原版LLaMA模型的32K词表进行合并的代码】

LLaMA-v2-Chat 与 Alpaca：什么时候应该使用每种 AI 模型？

SentencePiece：pieces、字节编码、Unicode字符【LLaMA-7b的分词器共32002个piece】【Chinese-LLaMA-Alpaca中文分词器共20000个piece】

【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B

LLMs：《Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca》翻译与解读

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca

深入理解LLaMA, Alpaca, ColossalChat 系列模型

LLaMA模型微调版本：斯坦福 Alpaca 详解

[大模型] LLaMA系列大模型调研与整理-llama/alpaca/lora（部分）

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的chec

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的che

我想学大模型，应该从哪个模型开始？LLaMA生态家谱整理和分析

【AI实战】快速搭建中文 33B 大模型 Chinese-Alpaca-33B

Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型

LLMs模型速览（GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca）

使用 Docker 和 Alpaca LoRA 对 LLaMA 65B 大模型进行 Fine-Tune

类ChatGPT模型LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE

[NLP]使用Alpaca-Lora基于llama模型进行微调教程

Llama-1｜Alpaca-LoRA 微调模型下载以及安装推理教程

Chinese-LLaMA-AIpaca

中文LLaMa和Alpaca大语言模型开源方案 | 扩充中文词表 & 针对中文语料进行高效编码

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

Llama2-Chinese项目：2.2-大语言模型词表扩充

Llama2-Chinese项目：1-项目介绍和模型推理

我应该选一所什么学校--所有选择，都应基于你的需要

这么多编程语言，具体都是做什么的，我们应该怎么选？

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)