ChatGPT真的那么牛吗？

作者：中国联通
链接：https://www.zhihu.com/question/581556221/answer/2896239115
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

这个冬天，ChatGPT火爆全球。作为AIGC的重要落地应用，ChatGPT真的那么牛吗？ChatGPT到底是什么？带来什么影响？中国版ChatGPT如何发展？通信产业如何着力？跟随阿通一起来看看联通数科首席AI科学家廉士国博士如何回答~

一、ChatGPT是什么？

廉士国：ChatGPT是一个面向对话场景的大语言模型，是在2020年发布的语言生成模型GPT-3版本基础上的改进版，又称为GPT-3.5版。它能通过与人类做文字对话的方式，针对人类输入的提示文字，提供相应的文字回答，且回答的内容“形式上合理”。

因为采用了自监督学习技术，而无需人工做数据标注，就可以用网络上大量公开文本数据来做模型训练，以形成沉淀了大量知识的模型。依赖于训练库中的文本数据涉及的领域，原则上只要是自然语言能够表述出的领域都可用来训练并能具备该领域的智能问答功能，例如历史、地理、数学、诗歌、编程等。目前大家在线体验的ChatGPT服务，是基于ChatGPT模型包装成的问答SaaS服务。

二、ChatGPT有什么影响？

廉士国：ChatGPT给人们带来新颖的体验，主要体现在其支持自然问答交互方式、能创作性组织文字内容、可记忆强大知识库、具备“多才多艺”能力等方面，在交互方式和能力上更“像”人。因为是基于自然语言数据训练的，其在自然语言或文字相关的功能上更成熟，例如百科知识查询、问题探讨或观点获取、文字创作等。

三、ChatGPT会如何影响AI产业格局和发展走势？

廉士国：ChatGPT目前在免费试用阶段，上线仅两个月已突破1亿用户数。据说后续会推出按月收费的商用版本，同时微软已正式推出基于ChatGPT的Bing搜索产品并正将其嵌入Office和Azure等产品中。

目前看，ChatGPT在B端产品中的定位相对明确，可作为辅助工具来改进已有产品或为人工提供助手功能。例如，虽然大模型里沉淀了大量知识，但它很难完全替代搜索引擎，因为其不能提供原始内容链接、不能做即时信息查询等，可作为使能工具来升级搜索引擎产品；它可为销售人员提供回复邮件自动生成工具，以降低人工工作量并提升效率等。

而作为C端产品，相对还不够明确，类似写论文、编程序、咨询顾问等的个人助手，是否存在合规性风险、商业模式问题等，有待探索，但同时也有较大可想像空间。但对算力基础设施的带动作用是明确的，无论是ChatGPT的研发（训练）和基于ChatGPT的应用（推理）都需要大量智能计算资源和数据存储及传输资源，因此具备智能算力中心的云计算企业将是受益者。从技术分层角度看，从底往上：智能算力平台、ChatGPT基础大模型、基于ChatGPT基础模型的AI应用或插件、行业应用系统。

可以预见：以智能算力平台为基础，会有少量公司做类似ChatGPT基础大模型，其他大量公司和开发者会基于ChatGPT基础模型做AI应用或插件，包括To B和To C类的，这些AI应用或插件可被集成到行业应用系统中。这种分层模式跟非大模型时代相似，只是现在大模型可能开始不再免费了，这是否说明会出现以ChatGPT基础大模型拥有者为中心的“寡头”？对标OpenAI的ChatGPT，谷歌刚刚发布了以其LaMDA大模型为基础的Bard对话服务。是否要出现类似iOS和Android两强对立的局面？

我们认为，目前阶段的基础大模型性能上还需完善，其门槛也没有高到只能出现两个“寡头”，更多玩家的局面将会出现。试用阶段的用户热度是否会延续，有赖于后续“爆款”AI应用的出现，但其对已有行业应用系统的升级辅助作用会持续体现出价值。

四、ChatGPT发展存在哪些挑战？它会对AI伦理、数字治理有什么影响？

廉士国：ChatGPT基础模型是基于文字间上下文关联关系做自监督训练的，以数据驱动为主、外加少量人工介入，其功能依赖于训练数据的数量和质量。从近期的大众试用反映来看，如果通过百科知识问答、写诗、做数学题和查询天气等测试来分别评估当前基础模型的记忆、创作、推理、查询能力，其相对从强到弱的排序是：记忆能力、创作能力、推理能力、查询能力。其推理能力相对较弱，这印证了国外部分专家的评价：当前版本模型对自然语言文本规则和模式知识学得较好，但对抽象知识和逻辑推理还没有学到位。其信息查询能力依赖于其训练数据的截止搜集时间，例如问“北京明天的天气是？”其回答“北京明天25度，天气晴朗”，因为其训练数据截止到2021年春夏之交，仅能查询2021年之前的信息。即使其创作能力较强，写出的诗、论文和问题建议在形式结构上看很合理，但细究其内部逻辑仍有不合理的拼凑感。

尽管ChatGPT本身还存在一些技术挑战，但大家已经看到了其威力，甚至已对现行制度带来了不利影响，例如有国外学生用它来代写课题论文并获得了高分，这给其他同学带来了不公平。的确，ChatGPT的出现超出了大家的预期，但我们的数字治理还没有跟上。像这样具备文字创作等能力的超级助手，人人都可以平等获得吗？其创作的内容存在版权问题吗、是否可以自由使用而不受限？其创作的内容如果存在编造事实、民族歧视、侵犯隐私等问题应由谁来担责？等等问题是需要大家共同来面对的。而人工智能领域的专家们已经开始考虑用技术手段来鉴别AI生成的内容了，例如通过人工规则来判断内容合法性、通过文本内容统计分析及添加文本水印等方法来鉴权等。我们相信，除了技术手段之外，相关的数字治理制度也将启动建立。

五、中国版ChatGPT如何发展？

廉士国：类似ChatGPT的大模型可通过基于自然语言的自监督学习技术实现对知识的沉淀，可作为公共的基础模型，支撑多种上层应用。因此，构建中文版的ChatGPT形成具备中文知识的公共基础模型，也尤为重要。

研发类似ChatGPT的大模型，其基础主要包括智能算力、大量数据、自监督学习算法等。对于这些基础，国内相关企业和机构是拥有的或可以联合构建。之前，已有国内企业和机构发布了大模型，包括语言大模型、基于语言大模型的多模态模型等，只是其语言大模型还没达到ChatGPT的能力。刚刚已有几家国内企业宣布在ChatGPT上做布局，相信国内很快会出现类似ChatGPT的语言大模型，并且对中文效果更好。

另外，国内的应用场景丰富、开发者众多，以ChatGPT类大模型为基础，面向垂直应用场景的再开发，可能出现“爆款”智能应用。而且，考虑到国内千行百业数字化转型的趋势，会产生丰富的行业场景数据，可能推进行业大模型的快速发展，包括语言类、多模类等，不限于对话场景，可在基础模型上做微调或重训练。

最后，ChatGPT的研发模式和历程值得我们借鉴。一方面，ChatGPT的研发要以巨大的算力和数据以及最前沿算法为基础，OpenAI公司能聚齐这些资源并具备产学研用融合特点，这种以公司牵头的产学研用融合研发体系值得借鉴。另一方面，虽然ChatGPT仅仅是OpenAI追求的AGI（通用人工智能）的初级阶段，但我们已看到了其创新带来的巨大影响力，这得益于OpenAI创始人和投资者的远见和坚持。大家可能还记得，OpenAI和DeepMind的投入-产出问题（亏损情况），曾是大家热议的话题，也反应在国内AI领域投资的波动上。从ChatGPT基础模型的研发历程来看，大模型研发是中长期积累的产物，如果仅追求短期回报可能反而会错过机会。这也给了国内投资者和创始人以启示，大的创新是需要中长期的坚持的，尤其人工智能领域还有很多未知待解决，就更需要坚定客观正确的方向不动摇。

六、ChatGPT对信息通信业有什么影响与互动？如何利用？

廉士国：ChatGPT实现了人与机器之间以文本方式“communication”的功能，接近甚至超越了人与人之间以文本方式聊天的体验，这与信息通信业要支撑的丰富人们的沟通与交流相似。

首先，ChatGPT大模型可作为工具用来改进信息通信服务能力，例如其在自然语言上的强大能力可用于提升智能客服、智慧运营、欺诈监测等运营服务功能，通信网络的巨量数据量可用来训练通信网络大模型赋能网络自主运行。其次，ChatGPT在自然语言上的成功，启示了在语音、视觉等多模态数据上的扩展空间，这将为运营商在政企业务上为千行百业数字化转型赋能提供重要工具。而且，ChatGPT等大模型的运行和服务离不开算力和网络支撑，运营商作为新型信息基础设施服务运营者，可以加强算网融合的智能算力中心建设，来承载ChatGPT等大模型训练和推理服务，真正让大模型服务遍及无处不在的用户。

可以预见，ChatGPT的流行会让人机自然对话的交互方式越来越普及，并很可能从文本对话模式扩展到语音对话模式，以及与数字人面对面交流模式，进而将大大提升信息通信流量和用户粘度，这也将推动信息通信业考虑从人与人之间的沟通交流扩展到人机之间的沟通交流。虽然传统搜索引擎已经不再是搜寻或咨询信息的普遍方式了，部分代之以基于知识沉淀的大模型构建的文本/语音/数字人对话机器人，但