被“开源”的 LLaMA 成最大赢家

本文源自一份被意外泄露的谷歌内部文件，作者是谷歌内部的一名研究员。虽然他在文章中提出了不少有意思的观点，但仅代表其本人的意见，并非谷歌公司的观点，而且许多其他研究人员也不同意这些观点。

原文：https://www.semianalysis.com/p/google-we-have-no-moat-and-neither

这名谷歌员工声称，在当下这场 AI 军备竞赛中，开源人工智能 (Open Source AI) 将会胜过谷歌和 OpenAI，成为最大赢家。他还认为，在 AI 领域谷歌没有护城河，OpenAI 也没有。

文件提到，今年 3 月初 Meta 的大语言模型 LLaMA 被泄露后，开源社区得到了第一个真正意义上的具备能力的基础模型。尽管 LLaMA 没有指令或对话调整，也没有 RLHF，但社区深刻认识到其重要性。随之而来的是巨大创新涌现，仅仅一个月后，就出现了包含指令调优、量化、质量改进、人工评估、多模态、RLHF 等 LLaMA 变体，其中许多变体建立在彼此之上。

延伸阅读：被泄露的大语言模型 LLaMA，助长了一系列 ChatGPT 开源替代品

虽然大公司的模型在质量方面仍然略有优势，但差距正在以惊人的速度缩小。开源模型更快、支持深度定制、更注重隐私保护且功能更强大。基于开源模型，开发者甚至可以使用 100 美元和 13B 的参数即可实现需求，而大公司却要在 1000 万美元和 540B 的参数下苦苦挣扎。更不用说他们可以在几周内完成任务，而不是几个月。

总之，大语言模型不存在什么“秘密武器”，参数太多的大模型反而造成拖累，最佳的模型是能快速迭代的。这名研究员认为关注开源模型的开发有助于避免重新发明轮子。

由于被“开源”的 LLaMA 出自 Meta 之手，这名研究员认为 Meta 是这场 AI 竞争中的最大受益者之一 —— 获得了全世界程序员的免费劳动力。因为大多数开源的 AI 创新都发生在他们的架构之上，因此没有什么能阻止 Meta 将这些成果直接整合到他们的产品中。

这种情况就好比谷歌成功使用其开源产品（如 Chrome 和 Android）中的范例，基于拥有“生长创新”的平台，谷歌巩固了自己作为思想领袖和方向制定者的地位，获得了塑造比自身更宏大的想法的能力。

由此可见，OpenAI 在对于开源 AI 的态度上犯了与谷歌相同的错误，都采取了较为封闭的政策，但这并不能帮助他们建造护城河。

被“开源”的 LLaMA 成最大赢家

猜你喜欢