【大模型】与 ChatGPT 齐平、可商用、更强的 LLaMA2 来了

业界资讯 2023-07-22 20:15:47 阅读次数: 0

【大模型】可商用且更强的 LLaMA2 来了

LLaMA2 简介
许可证
参考

LLaMA2 简介

2023年7月19日：Meta 发布开源可商用模型 Llama 2。

Llama 2是一个预训练和微调的生成文本模型的集合，其规模从70亿到700亿个参数不等。

经过微调的LLMs称为Llama-2-Chat，针对对话用例进行了优化。Llama-2-Chat模型在我们测试的大多数基准测试中都优于开源聊天模型，在对有用性和安全性的人工评估中，与ChatGPT和PaLM等一些流行的封闭源代码模型不相上下。

LLaMA-2-chat 几乎是开源模型中唯一做了 RLHF 的模型。LLaMA-2 经过 5 轮 RLHF 后，在 Meta 自己的 reward 模型与 GPT-4 的评价下，都表现出了超过 ChatGPT 性能。

论文

https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

GitHub

地址：https://github.com/facebookresearch/llama

huggingface

地址：https://huggingface.co/meta-llama

模型列表

在这里插入图片描述

Llama2-chat：
Llama2-chat-7B
Llama2-chat-13B
Llama2-chat-70B

其他模型请查看：https://huggingface.co/meta-llama

训练数据

在超过2万亿tokens数据集上训练。
微调数据包括公开可用的指令数据集，以及超过100万个新的人工注释示例。
预训练数据的截止日期为2022年9月

训练信息

所有模型都使用全局批量大小为4M tokens进行训练。
更大的700亿参数模型使用Grouped-Query Attention（GQA）来提高推理可扩展性。
训练时间为2023年1月至2023年7月。
是一个纯文本模型。
预训练过程中，在 A100-80GB 花费了33万GPU小时。

模型信息

在这里插入图片描述
上下文长度为 4K。

许可证

免费商用
需要注册申请

参考

1.https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/
2.https://github.com/facebookresearch/llama

3.https://huggingface.co/meta-llama
4.Llama2-chat-7B
5.Llama2-chat-13B
6.Llama2-chat-70B

猜你喜欢

转载自blog.csdn.net/zengNLP/article/details/131800362

【大模型】与 ChatGPT 齐平、可商用、更强的 LLaMA2 来了

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

llama2模型下载

打起来了~ 最小SOTA模型：Mistral 7B，各方面碾压LLaMA2 13B和LLaMA1 34B

基于Llama2模型的开源模型

【大模型】更强的 ChatGLM3-6B 来了，开源可商用

[NLP]llama2模型下载地址

Meta发布升级大模型LLaMA 2：开源可商用

Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型

Sealos 国内集群正式上线，可一键运行 LLama2 中文版大模型！

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM2/LLaMA2/Baichuan等】的高效工具【预训练+指令监督微调+

“伶荔”(Linly) 项目发布中文LLaMA2模型

【LLM模型篇】LLaMA2 | Vicuna | EcomGPT等

[NLP]LLM---FineTune自己的Llama2模型

更强的Llama 2开源，可直接商用：一夜之间，大模型格局变了

异构边缘上的快速、可移植的 Llama2 推理

【大模型】长度 32K 上下文的 ChatGLM2-6B-32K 来了，开源可商用

Baichuan2开源大模型正式发布，王小川：性能超过LLaMA2

如何微调医疗大模型llm：llama2学习笔记

使用 Docker 快速上手中文版 LLaMA2 开源大模型

使用 Docker 快速上手官方版 LLaMA2 开源大模型

Llama2开源大模型的新篇章以及在阿里云的实践

探索 Llama2 大语言模型：设置、利用和快速工程

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

大语言模型之十二 SentencePiece扩充LLama2中文词汇

在Linux系统下微调Llama2（MetaAI）大模型教程—Qlora

在Linux系统下部署Llama2（MetaAI）大模型教程

llama.cpp LLM模型 windows cpu安装部署；运行LLaMA2模型测试

刷新多个SOTA！Meta重磅新作AnyMAL：多模态版Llama2来了！

UCloud上线可商用LLaMA2镜像，助力AGI应用发展

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)