当地时间周二(3月14日)，人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4.该公司表示，GPT-4在许多专业测试中表现出超过绝大多数人类的水平。

，时长24:27

OpenAI GPT-4官方演示视频

OpenAI表示，我们已经创建了GPT-4，这是OpenAI在深度学习规模化方面的最新里程碑。GPT-4是一个大型的多模型模型（接受图像和文本输入、输出文本），虽然在许多现实场景中不如人类聪明，但在各种专业和学术基准测试中表现出人类水平的性能。

看起来，现在的 GPT 已经不会在计算上胡言乱语了：

还是个物理题：

GPT-4 看懂了法语题目，并完整解答：

GPT-4 可以理解一张照片里「有什么不对劲的地方」：

　　OpenAI于2020年发布了GPT（生成型预训练变换模型）-3（生成型预训练变换模型），并将其与GPT-3.5分别用于创建Dall-E和聊天机器人ChatGPT，这两款产品极大地吸引了公众的关注，并刺激其他科技公司更积极地追求人工智能（AI）。

　　OpenAI周二表示，在内部评估中，相较于GPT-3.5，GPT-4产生正确回应的可能性要高出40%。而且GPT-4是多模态的，同时支持文本和图像输入功能。

　　OpenAI称，GPT-4比以前的版本“更大”，这意味着其已经在更多的数据上进行了训练，并且在模型文件中有更多的权重，这使得它的运行成本更高。

　　据OpenAI介绍，在某些情况下，GPT-4比之前的GPT-3.5版本有了巨大改进，新模型将产生更少的错误答案，更少地偏离谈话轨道，更少地谈论禁忌话题，甚至在许多标准化测试中比人类表现得更好。

　　例如，GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右。

　　OpenAI表示，虽然两个版本在日常对话中看起来很相似，但当任务复杂到一定程度时，差异就表现出来了，GPT-4更可靠、更有创造力，能够处理更微妙的指令。

　　不过，OpenAI也警告称，GPT-4还不完美，在许多情况下，它的能力不如人类。该公司表示：“GPT-4仍有许多已知的局限性，我们正在努力解决，比如社会偏见、幻觉和对抗性提示。”

　　OpenAI透露，摩根士丹利正在使用GPT-4来组织数据，而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan Academy和冰岛政府。

　　OpenAI合作伙伴微软周二表示，新版必应搜索引擎将使用GPT-4。

OpenAI公布GPT-4：可在考试中超过90%的人类