基于LLaMA-2进行微调的FreeWilly2开源语言模型 - 代码天地

基于LLaMA-2进行微调的FreeWilly2开源语言模型

企业开发 2023-09-30 04:00:52 阅读次数: 0

FreeWilly2是由Stability AI基于Llama2 70B所微调后发布的大语言模型，该模型的部分推理能力甚至已经超越了openAI的GPT-3.5。截止至发稿前，该模型在HuggingFace的开源语言模型排行榜中位列榜首，大部分语言模型加载工具也正在处于积极适配中。

看来开源语言模型终于要变天了，毕竟现在各种技术层出不穷，就像站长所说的，超越闭门造车不再open的oepnAI，只是时间问题。

模型描述

FreeWilly2是一个在Orca风格数据集上微调的Llama2 70B模型。Stability AI及其CarperAI实验室自豪地宣布FreeWilly1及其后继者FreeWilly2，这是两个强大的新型开放访问的大型语言模型（LLM）。这两个模型在各种基准测试中展现出了卓越的推理能力。FreeWilly1利用了原始的LLaMA 65B基础模型，并通过新的合成数据集使用标准Alpaca格式进行了精心微调。类似地，FreeWilly2利用了LLaMA 2 70B基础模型，其性能在某些任务上与GPT-3.5相比表现出色。

数据生成和收集

FreeWilly模型的训练直接受到了微软在其论文《Orca：从GPT-4的复杂解释跟踪中进行渐进学习》中开创的方法的启发。虽然我们的数据生成过程类似，但我们在数据来源上有所不同。

我们的数据集变种包含了60万个数据点（大约是原始Orca论文使用的数据集大小的10%），这些数据点是通过对以下由Enrico Shippole创建的高质量指令数据集进行语言模型提示而生成的：

通过这种方法，我们使用一个较简单的LLM模型生成了50万个示例，并使用一个更复杂的LLM模型生成了额外的10万个示例。为了确保公平比较，我们仔细筛选了这些数据集，并删除了来自评估基准的示例。尽管训练样本大小仅为原始Orca论文的十分之一（大大减少了与原始论文相比训练模型的成本和碳足迹），但由此产生的FreeWilly模

猜你喜欢

转载自blog.csdn.net/u010291330/article/details/132580807

基于LLaMA-2进行微调的FreeWilly2开源语言模型

Llama 2：开源语言模型的未来

Llama 2｜Meta开源语言模型

llama2.c｜纯C语言推理开源语言模型Baby LLaMA

大语言模型之七- Llama-2单GPU微调SFT

大语言模型之十五-预训练和监督微调中文LLama-2

开源语言大模型演进史：向LLaMA 2看齐

Meta｜LLaMA开源语言模型

LLM微调（二）| 微调LLAMA-2和其他开源LLM的两种简单方法

Llama-2 推理和微调的硬件要求总结：RTX 3080 就可以微调最小模型

LLaMA开源语言模型泄漏版下载

基于Llama2模型的开源模型

大语言模型之四-LlaMA-2从模型到应用

微调 Llama-2 7B 模型以生成 Python 代码有关如何使用 PEFT、QLoRa 和 Huggingface 实用程序微调新 Llama-2 的演示

微调语言大模型选LoRA还是全参数？基于LLaMA 2深度分析

Llama-2大模型本地部署研究与应用测试

免费商用 Meta 发布开源大语言模型 Llama 2

基于peft 微调 LLaMa模型

只用1块A100，就能训练自己的Llama-2模型

以Llama-2为例，在生成模型中使用自定义StoppingCriteria

NLP（六十四）使用FastChat计算LLaMA-2模型的token长度

以Llama-2为例，在生成模型中使用自定义LogitsProcessor

Meta 开源基于 Llama 2 的 AI 代码生成大模型：Code Llama

Code Llama 是Meta 开源基于 Llama 2 的 AI 代码生成大模型

使用QLoRA对Llama 2进行微调的详细笔记

训练自己的Llama 2！大模型微调技术介绍

使用 DPO 微调 Llama 2

开源语言大模型的正确姿势

LLMs之LLaMA2：基于云端进行一键部署对LLaMA2模型实现推理(基于text-generation-webui)执行对话聊天问答任务、同时微调LLaMA2模型(配置云端环境【A100】→下载数

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)