被“开源”的 LLaMA 成最大赢家

本文源自一份被意外泄露的谷歌内部文件,作者是谷歌内部的一名研究员。虽然他在文章中提出了不少有意思的观点,但仅代表其本人的意见,并非谷歌公司的观点,而且许多其他研究人员也不同意这些观点。

原文:https://www.semianalysis.com/p/google-we-have-no-moat-and-neither

这名谷歌员工声称,在当下这场 AI 军备竞赛中,开源人工智能 (Open Source AI) 将会胜过谷歌和 OpenAI,成为最大赢家。他还认为,在 AI 领域谷歌没有护城河,OpenAI 也没有。

文件提到,今年 3 月初 Meta 的大语言模型 LLaMA 被泄露后,开源社区得到了第一个真正意义上的具备能力的基础模型。尽管 LLaMA 没有指令或对话调整,也没有 RLHF,但社区深刻认识到其重要性。随之而来的是巨大创新涌现,仅仅一个月后,就出现了包含指令调优、量化、质量改进、人工评估、多模态、RLHF 等 LLaMA 变体,其中许多变体建立在彼此之上。

延伸阅读:被泄露的大语言模型 LLaMA,助长了一系列 ChatGPT 开源替代品

虽然大公司的模型在质量方面仍然略有优势,但差距正在以惊人的速度缩小。开源模型更快、支持深度定制、更注重隐私保护且功能更强大。基于开源模型,开发者甚至可以使用 100 美元和 13B 的参数即可实现需求,而大公司却要在 1000 万美元和 540B 的参数下苦苦挣扎。更不用说他们可以在几周内完成任务,而不是几个月。

总之,大语言模型不存在什么“秘密武器”,参数太多的大模型反而造成拖累,最佳的模型是能快速迭代的。这名研究员认为关注开源模型的开发有助于避免重新发明轮子。

由于被“开源”的 LLaMA 出自 Meta 之手,这名研究员认为 Meta 是这场 AI 竞争中的最大受益者之一 —— 获得了全世界程序员的免费劳动力。因为大多数开源的 AI 创新都发生在他们的架构之上,因此没有什么能阻止 Meta 将这些成果直接整合到他们的产品中。

这种情况就好比谷歌成功使用其开源产品(如 Chrome 和 Android)中的范例,基于拥有“生长创新”的平台,谷歌巩固了自己作为思想领袖和方向制定者的地位,获得了塑造比自身更宏大的想法的能力。

由此可见,OpenAI 在对于开源 AI 的态度上犯了与谷歌相同的错误,都采取了较为封闭的政策,但这并不能帮助他们建造护城河。

猜你喜欢

转载自www.oschina.net/news/239488/google-we-have-no-moat-and-neither
今日推荐