ChatGPT 扫盲指南:快速了解 AI 聊天机器人

ChatGPT 已迅速成为自 2007 年第一代 Apple iPhone 以来最重要的技术发布之一。聊天机器人现在是历史上增长最快的消费者应用软件,仅两个月就吸引了 1 亿用户——但它也是一个快速变化的 AI 变形器,这会使它变得混乱和让人不知所措。

这就是为什么我们整理了这个定期更新的解释器来回答您所有紧迫的 ChatGPT 问题。你到底能用它做什么?ChatGPT 代表什么?它什么时候会转移到下一代 GPT-4 模型?我们已经在下面回答了所有这些问题和更多问题。不,ChatGPT 也不愿意对所有这些发表评论。

在本指南中,我们将主要介绍 OpenAI 自己的 ChatGPT 模型,该模型于 2022 年 11 月推出。从那时起,ChatGPT 引发了一场人工智能军备竞赛,微软在其新的 Bing 搜索引擎和 Microsoft Edge 浏览器中使用了一种聊天机器人形式。谷歌也做出回应,宣布推出一款名为Google Bard 的聊天机器人,暂定为“实验性对话式 AI 服务” 。

ChatGPT与现在推出的 Google Bard以及我们测试过的其他ChatGPT 替代方案相比仍然具有一些优势,但这些只是 ChatGPT 的竞争对手和分支的开始。OpenAI 现在为开发人员提供 API(应用程序编程接口),以将其技能构建到其他程序中,以及一些新的插件。事实上,Snapchat 已经发布了一款名为“My AI”的聊天机器人,它运行在最新版本的 OpenAI 技术上,而一种名为 Duolingo Max 的新学习体验运行在其新的 GPT-4 模型上。

不过,就目前而言,这里解释了所有 ChatGPT 基础知识——以及我们对 AI 聊天机器人在不久的将来的发展方向的看法。

什么是ChatGPT ?

ChatGPT 是一个 AI 聊天机器人,最初建立在一系列统称为 GPT-3 的大型语言模型 (LLM) 之上。OpenAI 现已宣布其下一代 GPT-4 模型可用。这些模型可以理解文本提示并生成类似人类的答案,因为它们已经过大量数据的训练。

例如,ChatGPT 最原始的 GPT-3.5 模型是在来自互联网的 570GB 文本数据上进行训练的,OpenAI 表示这些数据包括书籍、文章、网站,甚至社交媒体。因为它接受了数千亿个单词的训练,ChatGPT 可以创建响应,用它自己的话说,就像是“一个友好而智能的机器人”。

这种对范围广泛的问题做出类似人类且经常准确的回答的能力是 ChatGPT 成为有史以来增长最快的应用程序的原因,仅两个月就达到了 1 亿用户。它也可以生成散文、文章和诗歌,这一事实只会增加它的吸引力(以及在教育等领域的争议)。

但早期用户也透露了 ChatGPT 的一些局限性。OpenAI 表示其回应“可能不准确、不真实,有时还会产生误导”。OpenAI 首席执行官山姆奥特曼也在 2022 年 12 月承认,人工智能聊天机器人“极其有限”,“现在任何重要的事情都依赖它是错误的”。

尽管如此,世界目前仍在探索 ChatGPT,尽管已推出付费 ChatGPT Plus 版本,但您仍然可以免费使用它。

CHATGPT 代表什么?

ChatGPT 代表“Chat Generative Pre-trained Transformer”。让我们依次看一下这些词中的每一个。

“聊天”自然是指 OpenAI 为其 GPT 语言模型构建的聊天机器人前端。第二个和第三个词表明该模型是使用“生成预训练”创建的,这意味着它已经过大量文本数据的训练以预测给定序列中的下一个词。

最后,还有“变压器”架构,这是 ChatGPT 所基于的神经网络类型。有趣的是,这个 transformer 架构实际上是由谷歌研究人员开发的(在新标签页中打开)2017 年,特别适合自然语言处理任务,例如回答问题或生成文本。

谷歌只是太热衷于指出它在开发这项技术中的作用(在新标签页中打开)在宣布Google Bard期间。但ChatGPT是将这一概念带入主流的AI聊天机器人,又获得了微软数十亿的投资,微软称其与个人电脑和互联网的发明同等重要。

CHATGPT 是什么时候发布的?

ChatGPT 于 2022 年 11 月 30 日作为“研究预览版”发布。博客文章(在新标签页中打开)随便向世界介绍了 AI 聊天机器人,OpenAI 表示“我们已经训练了一个名为 ChatGPT 的模型,它以对话方式进行交互”。

界面就像现在一样,是一个简单的文本框,允许用户回答后续问题。OpenAI 表示,你现在可以在新的 Bing 搜索引擎中看到的对话格式允许 ChatGPT “承认错误,挑战不正确的前提,并拒绝不适当的请求”。

ChatGPT 基于 GPT-3.5 系列的语言模型,OpenAI 表示该模型已于 2022 年初完成培训。ChatGPT Plus 订阅者现在可以使用更高级的 GPT-4 模型。OpenAI 之前也确实以有限的形式发布了早期的 GPT 模型——例如,其 GPT-2 语言模型于 2019 年 2 月发布(在新标签页中打开),但该公司表示,“由于我们担心该技术的恶意应用”,它不会发布经过全面训练的模型。

OpenAI 还于 2020 年 6 月发布了一个更大、功能更强大的模型,称为 GPT-3。但直到 2022 年 11 月 ChatGPT 的全面到来,该技术才一跃成为主流。

CHATGPT 的费用是多少?

ChatGPT 仍然可以免费使用,但现在也有付费层级。在关于ChatGPT Professional 层级的谣言越来越多之后,OpenAI 在 2 月份表示,它正在美国推出名为 ChatGPT Plus 的“试点订阅计划”。一周后,它向世界其他地区开放了订阅层。

ChatGPT Plus 的费用为每月 20 美元(约合 17 英镑/30 澳元),并比免费套餐带来一些好处。它承诺即使在高峰时段也能为您提供对 ChatGPT 的完全访问权限,否则您会在停机时段经常看到“ChatGPT 现在已满负荷”消息。

OpenAI 表示,ChatGPT Plus 订阅者还获得了“更快的响应时间”,这意味着您应该比免费版本快三倍左右获得答案(尽管这并非无懈可击)。最后的好处是“优先使用新功能和改进”,例如实验性“Turbo”模式可以进一步缩短响应时间。

目前尚不清楚 OpenAI 将保留其免费的 ChatGPT 层多长时间,但目前的迹象是有希望的。该公司表示“我们热爱我们的免费用户,并将继续免费提供 ChatGPT”。现在,订阅显然有助于支持免费访问 ChatGPT。这是否会长期持续是另一回事。

CHATGPT 如何运作?

ChatGPT 的创建有一个主要目标——预测句子中的下一个单词,基于它所训练的千兆字节文本数据中通常发生的事情。

一旦您向 ChatGPT 提出问题或提示,它就会通过 AI 模型,聊天机器人会根据您提供的信息以及如何适应其大量训练数据来生成响应。正是在这次培训中,ChatGPT 了解了在给定的上下文中,什么词或词序列通常跟在最后一个词之后。

为了深入了解这个过程,我们建议留出几个小时来阅读 Stephen Wolfram 的这篇博文(在新标签页中打开)(Wolfram Alpha的创造者(在新标签页中打开)搜索引擎),它在像 ChatGPT 这样的“大型语言模型”的引擎盖下,可以窥视它们的内部工作原理。

但简短的回答是什么?ChatGPT 的工作归功于深度学习算法、一些自然语言处理和大量生成预训练的组合,所有这些结合起来帮助它对文本问题产生类似人类的回答。即使它最终接受的训练只是根据它成为世界上最贪婪的读者的经验来填写下一个词。

您可以使用 CHATGPT 做什么?

ChatGPT 已经接受过大量文本的训练,涵盖了广泛的主题,因此它的可能性几乎是无穷无尽的。但在早期,用户已经发现了几种使用 AI 助手的特别有用的方法。

从广义上讲,这些可以分为自然语言任务和编码辅助。在我们关于使用 ChatGPT 的六种令人兴奋的方法的指南中,我们展示了如何使用它来起草信件、写诗和创作(或改编)小说。也就是说,它仍然有其局限性,正如我们在ChatGPT 向我们展示了它距离编写一部轰动一时的电影还有多远时所发现的那样。

不过,这并没有阻止自助出版作者接受这项技术。随着 YouTube 和 Reddit 论坛上充斥着有关如何使用 AI 技术写小说的教程,亚马逊Kindle 商店已经快被 ChatGPT 创作的书籍淹没了。

ChatGPT 喜欢的其他基于语言的任务是翻译、帮助您学习新语言(注意,Duolingo)、生成工作描述和制定膳食计划。只需告诉它您拥有的原料和您需要服务的人数,它就会突然冒出一些令人印象深刻的想法。

但 ChatGPT 在编码和生产力任务方面也同样有天赋。对于前者,它从自然语音创建代码的能力使其成为不熟悉特定语言或想要对现有代码进行故障排除的新手和有经验的编码人员的强大盟友。不幸的是,它也有可能被滥用来创建恶意电子邮件和恶意软件。

如果您将目光从基于浏览器的聊天功能转移到 API,ChatGPT 的功能将变得更加令人兴奋。我们已经学会了如何将 ChatGPT 与 Siri 结合使用,以及如何彻底改造 Apple 的语音助手,这很可能会威胁到这家科技巨头曾经领先市场的辅助软件。

我们也特别期待看到它与我们最喜欢的一些云软件和最佳生产力工具集成。ChatGPT 可以通过多种方式改造 Microsoft Office ,并且已经有人为 Google Slides 制作了一个漂亮的 ChatGPT 插件。微软还宣布,人工智能技术将融入 Skype,它将能够制作会议摘要或根据群聊中弹出的问题提出建议。

什么是聊天 GPT-4?

3 月 14 日,OpenAI 宣布其下一代语言模型GPT-4可供开发人员和 ChatGPT Plus 订阅者使用——微软确认(在新标签页中打开)新的 Bing 已经在 GPT-4 上运行。

与 GPT-3.5 相比最大的变化是 OpenAI 最新的语言模型是多模态的,这意味着它可以同时处理文本和图像。这意味着您可以向它显示图像,它会在文本提示旁边做出响应—— 《纽约时报》指出这是一个早期的例子(在新标签页中打开),涉及给 GPT-4 一些冰箱内容的照片,并询问你可以用这些食材做些什么饭菜。

上述功能尚未向公众发布,但 GPT-4 在其他方面也对其前身进行了改进。

在 GPT-4 上运行的应用程序,如 ChatGPT,将具有更好的理解上下文的能力。例如,该模型可以生成更准确且与您的提示或查询相关的语言。GPT-4 也是比其前身更好的多任务处理程序,这要归功于同时执行多项任务的能力有所提高。

OpenAI 还表示,安全是 GPT-4 的一大重点,OpenAI 花了六个多月的时间使其通过更好的监控框架,并与医学和地缘政治等一系列专业领域的专家一起确保其答案既准确又灵敏。

虽然 GPT-4 不是 GPT-3.5 的革命性飞跃,但它是朝着聊天机器人和 AI 驱动的应用程序迈出的又一重要步骤,这些应用程序更贴近事实,不会像我们最近看到的那样失控过去的。

猜你喜欢

转载自juejin.im/post/7246777363257737273