LLM-202212-Claude：《Constitutional AI: Harmlessness from AI Feedback》 - 代码天地

LLM-202212-Claude：《Constitutional AI: Harmlessness from AI Feedback》

企业开发 2023-09-03 10:49:16 阅读次数: 0

序言

自 11 月 30 日 ChatGPT 发布，其令人惊艳的对话能力，在业界引发了对通用人工智能的热潮。截止发文，OpenAI 一直保持遥遥领先，且并未透露更多的技术细节。然近日，一款新的 AI 助手 Claude 发布，ChatGPT 终于迎来强有力的竞争对手，本文中 chowgenxiao 和 fairyang 将介绍 Claude 背后的技术，欢迎大家一起讨论~

背景

Claude 是 Anthropic[1] 新推出的一款类似于 ChatGPT[2] 的 AI 助手，后者是从 OpenAI 出走的前员工们集体创建的 AI 初创公司。虽然目前尚未开放公测，但从曝光的内测对比结果来看，Claude 已经可以和 ChatGPT 掰掰手腕：在逻辑和计算方面，Claude 表现出了旗鼓相当的实力，尽管在代码生成和推理问题上存在差距，但在无害性方面表现突出，具体表现为能够更清晰的拒绝不恰当的请求，当面对超出能力范围的问题，能够主动坦白，而不是像 ChatGPT 那样逃避回答[3][4][5]。

同时 Anthropic 也发布出了 Claude 对应的论文《Constitutional AI: Harmlessness from AI Feedback》[6]。论文作者列表中包含较多的 OpenAI 工作背景的核心成员。在所有现有公开材料中，这篇 22 年 12 月 15 日发布的论文，成为从技术背景和时鲜性两方面最贴近 ChatGPT 的文章。这篇论文的价值，不仅在于提供了一种稍低成本的新技术思路，也对 ChatGPT 的技术复现有非常大的借鉴价值（模型参数、训练样本、标注平台、训练细节、人力分工等)。下面我们将围绕这篇论文，介绍 Claude 背后的技术。

Claude 的独

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/132548198

LLM-202212-Claude：《Constitutional AI: Harmlessness from AI Feedback》

Learn From AI

【LLM】RLHF机制（Reinforcement Learning from Human Feedback）

AI

DL ML AI——From 0 to 1

Databricks 开源 LLM AI

Claude AI和ChatGPT的区别

【论文阅读】Learing to summarize from human feedback

如何做研究？（From: MIT AI LAB）

MONAI 专为医学AI开发的开源框架（From Nvidia）

A Survey of Embodied AI: From Simulators to Research Tasks 论文阅读

Key Insights from the First Year of AI at Google Brain

Claude2 AI实战：简历优化

访问Claude AI 的 3 种方法

文献阅读 BPR: Bayesian Personalized Ranking from Implicit Feedback

VBPR: Visual Bayesian Personalized Ranking from Implicit Feedback

training a helpful and harmless assistant with refinforcement learning from human feedback

AlpacaFarm: A Simulation Framework for Methods that Learn from Human Feedback

RLHF：基于人类反馈（Human Feedback）对语言模型进行强化学习【Reinforcement Learning from Human Feedback】

AI平台

AI入门

fast ai

AI简介

ai学习

AI and Robot

BNB AI

AI初识

最近的AI

游戏AI

AI策略

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)