LLM-202212-Claude:《Constitutional AI: Harmlessness from AI Feedback》

序言

自 11 月 30 日 ChatGPT 发布,其令人惊艳的对话能力,在业界引发了对通用人工智能的热潮。截止发文,OpenAI 一直保持遥遥领先,且并未透露更多的技术细节。然近日,一款新的 AI 助手 Claude 发布,ChatGPT 终于迎来强有力的竞争对手,本文中 chowgenxiao 和 fairyang 将介绍 Claude 背后的技术,欢迎大家一起讨论~

背景

Claude 是 Anthropic[1] 新推出的一款类似于 ChatGPT[2] 的 AI 助手,后者是从 OpenAI 出走的前员工们集体创建的 AI 初创公司。虽然目前尚未开放公测,但从曝光的内测对比结果来看,Claude 已经可以和 ChatGPT 掰掰手腕:在逻辑和计算方面,Claude 表现出了旗鼓相当的实力,尽管在代码生成和推理问题上存在差距,但在无害性方面表现突出,具体表现为能够更清晰的拒绝不恰当的请求,当面对超出能力范围的问题,能够主动坦白,而不是像 ChatGPT 那样逃避回答[3][4][5]。

同时 Anthropic 也发布出了 Claude 对应的论文《Constitutional AI: Harmlessness from AI Feedback》[6]。论文作者列表中包含较多的 OpenAI 工作背景的核心成员。在所有现有公开材料中,这篇 22 年 12 月 15 日发布的论文,成为从技术背景和时鲜性两方面最贴近 ChatGPT 的文章。这篇论文的价值,不仅在于提供了一种稍低成本的新技术思路,也对 ChatGPT 的技术复现有非常大的借鉴价值(模型参数、训练样本、标注平台、训练细节、人力分工等)。下面我们将围绕这篇论文,介绍 Claude 背后的技术。

Claude 的独

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/132548198
AI