免费商用 Meta 发布开源大语言模型 Llama 2 - 代码天地

免费商用 Meta 发布开源大语言模型 Llama 2

业界资讯 2023-08-13 00:14:35 阅读次数: 0

Meta 和微软深度合作，正式推出下一代开源大语言模型 Llama 2，并宣布免费提供给研究和商业使用。

Llama 2 论文地址：Llama 2: Open Foundation and Fine-Tuned Chat Models

据介绍，相比于 Llama 1，Llama 2 的训练数据多了 40%，上下文长度是 Llama 1 的 2 倍，并采用了分组查询注意力机制。具体来说，Llama 2 预训练模型是在 2 万亿的 token 上训练的，微调 Chat 模型是在 100 万人类标记数据上训练的。

Meta 称 Llama 2 在许多外部基准测试中，包括推理、编码、熟练度和知识测试中，都超过其他模型表现。

Llama 2 包括 Llama 2 和 Llama 2-Chat，包含了 70 亿、130 亿和 700 亿参数 3 个版本，其中 Llama 2-Chat 针对双向对话进行了微调，并且跟 ChatGPT 类似， Llama 2-Chat 也经历了预训练阶段 (PT)、指令微调 (SFT) 以及人类反馈强化学习 (RLHF) 三个阶段。

Meta 表示 Llama 2 可免费用于研究和商业用途，开发者们可以直接在 Llama 2 官方网站下载该模型。

地址：https://ai.meta.com/resources/models-and-libraries/llama-downloads/

BTW，根据 Llama 2 的授权政策，如果企业的月活用户数超过 7 亿，则必须从 Meta 申请许可证。Meta 会对此类授权进行严格设限。

为了防止此前 LLaMA 泄漏后带来的深度伪造和色情聊天机器人等不良信息和产品的出现，Llama 2 已经过红队测试，避免模型产出不良和有害内容，并且为开发者们制定了使用指南和守则。

Meta 发布首个开源可商用大语言模型的举动，无疑是在硬刚 OpenAI 和谷歌两大巨头。毕竟 OpenAI 的 GPT-4 和谷歌的 PaLM 2 走的都是 “技术保密路线”。Meta 首席科学家、图灵奖获得者 Yann LeCun 认为，Meta 此举可能将改变大模型行业的竞争格局

微软拥抱Meta， OpenAI，

猜你喜欢

转载自blog.csdn.net/ejinxian/article/details/132004686

免费商用 Meta 发布开源大语言模型 Llama 2

Meta 放大招：发布开源大语言模型 Llama 2，可免费商用

Meta发布升级大模型LLaMA 2：开源可商用

Meta被曝明年发布「开源版GPT-4级」全新大模型！参数量比Llama 2大数倍，可免费商用

Llama 2｜Meta开源语言模型

Meta LlaMA 2 最强的AI大语言模型！完全免费开源了！！附最新下载方式

微软又赢麻了！联合 Meta 发布免费商业应用的开源 AI 模型 Llama 2

微软Office AI工具定价每人每月30美元；Meta开源免费可商用大语言模型Llama 2；美团申请美团光年商标|极客头条

Meta 开源基于 Llama 2 的 AI 代码生成大模型：Code Llama

Code Llama 是Meta 开源基于 Llama 2 的 AI 代码生成大模型

Meta｜LLaMA开源语言模型

Meta 正在构建新开源大模型，性能超越 Llama 2、比肩 GPT-4

Meta AI研究团队新AI模型： Llama 2 大语言模型

Meta 最新发布 LLaMA 2（允许商业化）

Meta 的新 Llama2 发布让您兴奋不已

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

更强的Llama 2开源，可直接商用：一夜之间，大模型格局变了

Meta AI 重磅发布代码大模型 Code Llama

Meta 推出的 LLaMA 大语言模型部署教程

Meta的LLama模型非官方下载方法

Meta最新模型LLaMA细节与代码详解

Meta 的 LLaMa 2 许可证并非开源许可证

亚马逊云科技现已支持 Meta 推出的最新 Llama 2 基础模型

使用 Transformers 量化 Meta AI LLaMA2 中文版大模型

灵雀云Alauda MLOps 现已支持 Meta LLaMA 2 全系列模型

Llama 2：开源语言模型的未来

Danswer 接入 Llama 2 模型｜免费在 Google Colab 上托管 Llama 2 API

【大模型】与 ChatGPT 齐平、可商用、更强的 LLaMA2 来了

Meta又向开源社区扔了一颗炸弹！发布AI代码生成SOTA大模型Code Llama

模型杂谈：使用 IN8 量化推理运行 Meta “开源泄露”的大模型（LLaMA）

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)