ChatGPT及相关产品体验与研究

我的Github博客仓库链接：ChatGPT及相关产品体验与研究 - Github

一、ChatGPT介绍

1. ChatGPT概述

一句话描述ChatGPT：一个能够通过对话得到你想要的答案的聊天机器人。

ChatGPT 是由 OpenAI 开发的一种基于深度学习的自然语言处理模型开发出来的聊天机器人程序，它采用了基于 Transformer 结构的模型架构。GPT代表代表 Generative Pre-training Transformer，意味着该模型是通过预训练阶段进行训练，从而可以在各种NLP任务中进行微调和应用。

在此为不太了解 ChatGPT 的同学简单科普一下 ChatGPT 与传统的语音引擎（Siri、小爱同学等）的区别， ChatGPT 能够完成Siri、小爱同学所有非平台独有的能力（如设一个定时闹钟或日历）。

传统的语音引擎在遇到不能理解的问题时，它会替你自动在网络上搜索相关的网页并提供给你，而现在 ChatGPT 可以将它所了解的内容，经过总结后回答出来。你甚至可以问他知不知道一个微博大V、B站UP主等，这个博主平时发哪些内容相关的帖子，甚至某一个视频的内容概览（只要它是21年前的数据）。它还可以理解上下文，意味着当它回答错误时，你甚至可以纠正它的错误，或者你让他每次回答后都添加一个表情包等。

ChatGPT使用案例

2. ChatGPT的发展历史

ChatGPT 的发展历史可以追溯到 2018年，当时 OpenAI 推出了第一个版本的GPT。该模型使用了一个非常庞大的数据集（WebText）进行训练，这些数据来自互联网上的各种文本源，包括新闻文章、博客、论坛帖子等等。这种预训练方式使得GPT能够自动理解并生成文本，从而为自然语言处理提供了一个更加高效和强大的基础。

2019年，OpenAI推出了更加强大的GPT-2，该模型在保持与GPT相似的预训练方式的同时，增加了更多的参数，使其能够生成更加流畅和自然的语言。GPT-2在一些NLP任务中的表现非常出色，但是由于其可能会被滥用，OpenAI决定不公开发布GPT-2的全部代码，而是只公开了一些小规模的模型和预训练模型的部分代码。

2020年，OpenAI又推出了更加强大的GPT-3。该模型拥有数十亿个参数，比之前的GPT模型更加庞大和强大。GPT-3在一系列的自然语言处理任务中的表现十分出色，包括机器翻译、问答、文本生成等等，甚至可以进行类似代码生成的任务。GPT-3的推出引起了广泛的关注和热议，成为当时NLP领域的重要突破之一。

ChatGPT 则是基于GPT模型的一个特定应用，旨在通过对话的方式与用户进行交互。它在GPT-2和GPT-3的基础上进一步优化和改进，可以作为智能客服、虚拟助手等应用的基础。随着人工智能技术的不断发展， ChatGPT 等自然语言处理技术将会成为越来越重要的工具和应用。

3. ChatGPT的原理

ChatGPT 的原理基于自然语言处理和深度学习技术。它采用了基于Transformer结构的模型架构，通过预训练的方式进行训练，并利用微调技术对特定任务进行优化。具体来说， ChatGPT 的原理包括以下几个方面：

语言模型： ChatGPT 首先是一个语言模型，它通过对海量文本数据进行预训练，学习了一种文本表示方式。这种表示方式可以将输入的自然语言文本转换成一个向量表示，同时具有上下文相关性，即相邻的词汇之间存在一定的语言关系。

Transformer结构： ChatGPT 采用了基于Transformer结构的模型架构。Transformer是一种用于序列到序列（Sequence-to-Sequence）学习的神经网络结构，具有良好的并行性和可扩展性。它由多个编码器和解码器组成，可以对输入的序列进行编码和解码，从而实现文本生成等任务。

预训练和微调： ChatGPT 在预训练阶段使用了一个大规模的数据集进行训练，从而学习到了一种通用的文本表示方式。在应用阶段，可以通过微调技术对模型进行调整，使其适应特定的任务，例如问答、聊天对话等等。微调时，可以通过有标注的数据进行监督学习，从而优化模型的参数，提高模型的性能。

上下文感知： ChatGPT 具有上下文感知能力，即在生成文本时可以考虑之前的对话历史。这使得 ChatGPT 可以生成更加准确和连贯的文本，从而更好地满足用户的需求。

总的来说， ChatGPT 的原理是基于深度学习和自然语言处理技术，通过预训练和微调的方式实现了自然语言生成和对话交互等任务。

4. ChatGPT能做什么？

ChatGPT 是一种基于自然语言处理的模型，可以通过对话的方式与用户进行交互。它可以完成以下一些任务：

聊天对话：ChatGPT可以与用户进行对话，回答用户提出的问题或者进行闲聊。
语言翻译：ChatGPT可以进行多语言翻译，将用户输入的文本翻译成其他语言。
文本生成：ChatGPT可以根据用户输入的关键词或者上下文生成相关的文本，例如自动回复邮件、生成新闻报道等。
智能客服：ChatGPT可以作为智能客服的核心，根据用户的问题自动回答，并为用户提供帮助和指导。
虚拟助手：ChatGPT可以作为虚拟助手，协助用户完成一些任务，例如设置提醒、安排日程等等。

总的来说，ChatGPT可以实现一些自然语言处理的任务，并在人机交互方面发挥重要作用。

举一个简单容易理解的句子来比喻 ChatGPT 出现前与出现后的对比：

出现前：你是一个学生，你有一个问题想要得到答案，于是与问导师（搜索引擎），老师说再图书馆（搜索结果）里有“图书1”（网页1）、“图书2”……，让你自己去书里找答案

出现后：你是学校校长，你有一个问题想要得到答案，全校的各个领域的教授（不同的模型）都坐在你的会议室里，你问任何问题，他们直接把答案总结后（AI生成的回答）告诉你

下面是一些OpenAI官网给出的一些实例，它们并不是单一模型能够做到的所有事，不同的模型可以完成不同的任务， ChatGPT 通过对话，将自然语言转换成不同的任务，交由不同的模型去完成，一些复杂的任务往往是由 ChatGPT 通过多个模型和技术完成的。

在这里插入图片描述

二、业内现有的产品方案调研

1. 微软 New Bing

微软于2019年7月宣布向OpenAI投资10亿美元，成为OpenAI的首席合作伙伴之一。

根据双方的协议，微软将成为OpenAI的首选云计算平台，并与OpenAI合作开发新的AI技术。

此次投资意味着OpenAI将获得更多的资源和支持，有助于推动其在AI研究和应用方面的进一步发展。

同时，这也是微软继续扩大在人工智能领域影响力的举措之一，加强了其与OpenAI在人工智能领域的合作和竞争优势。

微软称新版必应（Bing）上线不到 48 小时，注册申请用户数量已经突破 100 万 - IT之家

在这里插入图片描述

2. 百度-文心百中

文心百中是百度文心大模型旗下的一个大模型驱动的产业级搜索系统产品。文心百中依托行业领先的文心ERNIE大模型，以极简的策略和系统方案，替代传统搜索引擎复杂的特征及系统逻辑，可低成本接入各类企业和开发者应用，并凭借数据驱动的优化模式可实现极致的行业优化效率及应用效果。

从目前能够在网络上检索到的信息来看，文心大模型于2020年5月份左右公布，文心百中于2022年12月份左右公布。

文心百中和Bing的区别主要有以下几点：

文心百中是基于百度文心大模型ERNIE的产业级搜索系统，而Bing是基于 ChatGPT 的搜索系统
ERNIE和 ChatGPT 都是基于Transformer的自然语言处理模型，但ERNIE更注重知识增强，而 ChatGPT 更注重对话生成。
文心百中使用新一代语义向量搜索模式替代传统倒排索引，可以更好地理解用户的搜索意图，提供更准确和相关的结果。Bing也使用了语义向量搜索模式，但可能没有文心百中的优化效果。
文心百中可以低成本接入各类企业和开发者应用，支持端到端集成，提供丰富的工具和平台支撑高效便捷的应用开发。Bing则主要面向普通用户，提供网页、图片、视频、新闻等搜索服务

在这里插入图片描述

文心百中的特点可以总结为三点：“极简的系统”、“强大的语义理解”和“极低的人力成本”。其涵盖的领域非常To B，有非常多的细分领域的搜索场景。

百度的文心大模型产业味道非常浓厚，它的“叶节点”正在向千行百业蔓延开来，它们分别是：

深燃-百度·文心：知识增强的燃气行业大模型
吉利-百度·文心：知识增强的汽车行业大模型
泰康-百度·文心：知识增强的保险行业大模型
TCL-百度·文心：知识增强的电子制造行业大模型
辞海-百度·文心：知识增强的社科行业大模型
国网-百度·文心
浦发-百度·文心
航天-百度·文心
人民网-百度·文心
冰城-百度·文心
电影频道-百度·文心

文心大模型-产业级知识增强大模型

在AI产业化这条道路上，百度正在发出一个非常明显的信号——框架、模型不仅要用起来，更重要是要打出去，用吴甜的话来说就是“生态太重要了”。

先让框架、大模型在企业，尤其是龙头企业铺展开来；而后通过反馈和优化，逐层向下更深入的应用起来。

在这里插入图片描述

ChatGPT 爆火和New Bing的强势公布的影响后，文心公布将在3月份推出类 ChatGPT 产品“文心一言”，具体就只能等到3月份正式公布之后，再看实际的效果了。

在这里插入图片描述

3. 京东-ChatJD

2月10日，京东云宣布，旗下言犀人工智能应用平台将推出产业版 ChatGPT ：ChatJD。并公布ChatJD的落地应用路线图“125”计划。

ChatJD的“125”计划是指ChatJD的落地应用路线图，包含一个平台、两个领域、五个应用。具体来说：

一个平台是指ChatJD智能人机对话平台，即自然语言处理中理解和生成任务的对话平台，预计参数量达千亿级。

两个领域分别为零售、金融，得益于京东云在这两个领域的深厚积累和优势。

五个应用包括：零售领域的智能客服、智能导购、智能营销；金融领域的智能风控、智能理财。

ChatJD的“125”计划旨在以产业AI力量，加速中国人工智能技术开发与落地，推动实体经济的发展。

2020年11月25日在JDDiscovery-2020京东全球科技探索者大会上，京东智能客服品牌名称“言犀”正式发布。

京东智能客服品牌焕新：“言犀”亮相2020京东JDD大会-京东云开发者社区

4. 谷歌-Bard

Bard是Google推出的一款会话型AI服务，它利用了Google在2021年发布的对话专用型AI LaMDA，可以模拟与人类的自然对话，提供有用的回答和建议。Bard可以从网上获取信息，提供新鲜、高质量的回应。Bard可以是创造力的出口，也可以是好奇心的跳板，帮助你了解NASA的詹姆斯·韦伯太空望远镜的新发现，或者与你的最喜欢的作家、音乐家、历史人物等进行对话。

Google 在2月8日向各界展示旗下的聊天机器人 Bard，并宣布 Bard 目前仅开放给小众用户尝鲜使用，随后将会在“未来几周内更广泛向公众开放”，可是 Bard 却出师不利！因为 Google 释出宣传自家聊天机器人 Bard 的短视频广告中，对用户提出的问题给出错误的答案，犯下低级错误！

在演示中，Bard 回答一个有关詹姆斯・韦伯太空望远镜（James Webb Space Telescope）的问题，该问题是“关于詹姆斯·韦伯太空望远镜，我可以告诉我9岁的孩子它有哪些新发现？”。对此，Bard给出了很多答案，最后一个回答就是，太阳系外行星的第一张照片，是用JWST拍摄的。然而有关回答却是错误的，根据美国国家航空航天局（NASA）给出的消息来看，其实早在 2004 年欧洲南方天文台的甚大望远镜（VLT），拍摄出第一张系外行星照片了。这种大的错误，还能通过 Google 各大单位，像是软件工程部门、公关部门以及营销部门，并出现在如此重大的演示中，可谓是相当的致命。随着 Bard 的出师不利，这让 Google 在今早开盘股价一度下跌 10%，损失达 1200 亿美元的市值！不过目前 Google 股价已经收窄跌幅，截至稿前下跌 7.68%。

参考文章：https://zinggadget.com/2023/02/09/google-聊天机器人-bard/

三、ChatGPT未来发展趋势

谈论 ChatGPT 的未来更不如我们把思维放大，不局限于 ChatGPT 这一个产品，而是放大到 ChatGPT 这一类对话式人工智能或者说自然语言处理类的人工智能的未来

1. 针对普通用户的AI产品

目前已经受到冲击的是搜索引擎行业，微软强势了宣布基于 ChatGPT 与必应的搜索数据研发的New Bing，在实际体验下来后，我们普通用户能够感受到的是划时代的搜索体验。我们不在需要在搜索引擎给出的一列列可能相关的网页中，苦苦寻找能够解决自己问题的答案，New Bing能够根据你提出的问题，在搜素引擎的数据中，筛选并总结出答案，并在回答中标注数据引用的来源网页，你可以明确的知道它得出的答案是来自于哪里。

虽然说，在目前看来它给出的答案不一定正确，且完全有可能曲解你的问题，并给出错误解释。但你可以根据它给出的来源，来确定答案的正确性，且可以指出并纠正它的错误。它与 ChatGPT 最大的不同就是具有极强的时效性， ChatGPT 只拥有2021年之前的数据，对2021年之后的事一概不知，而New Bing能够对当下发生的事立即做出反应（当天发生、第二天就能够得到回答）未来的搜索引擎格局一定会因此发生重大变化。

2. 针对产业的AI产品

国内能够了解到的自然语言处理相关的大模型，百度的文心百中 与 京东的言犀 皆是走的 产业化路线。文心百中与十一个不同的产业进行合作，为其提供不同的定制化行业知识增强型AI，帮助其提高生产效率或协助智能化建设，而京东的言犀则是在智能客服方面拥有深度合作与长期布局。考虑到成本与发展，国内的人工智能主要布局垂直场景的业务，意在打造属于自己的产业化AI生态。未来可能会有更多的产业逐渐接入人工智能，走智能化建设道路，降低成本提高生产效率，相比C端产品，更注重 稳定性 和 专业性，而非针对普通用户的那种 全能性。

四、ChatGPT对未来影响

在调研的过程中，我也在积极地使用与体验 ChatGPT ，并在这个过程中得到了 New Bing 的体验资格。

在完成这篇文章的时候，我深刻地体会到了时代变化的来临，微软带来的 New Bing，整体交互体验是非常划时代的，与百度、谷歌相比，甚至都不是一个时代的东西。由于 New Bing 几乎是 ChatGPT 的完全升级版，之后我将更多地考虑NewBing带来的影响。

1. 简单、直接的获取答案的体验

你提问，它回答，没有中间自己筛选答案的繁琐，这与我们曾经使用搜索引擎的习惯完全不同。对于不太擅长从搜索结果中筛选答案的人，NewBing可能将成为他们的百科全书，所有答案唾手可得。这和《原神》这个游戏中，须弥地区人们使用的“虚空终端”有异曲同工之妙。

2. 过度依赖会使人们失去自主思考的能力

提问即答案，这样省去了自主思考而获得答案过程，会让过度使用它的人逐渐丧失自主思考的能力。想象一下一个人遇到问题的时候，想到的第一件事就是去问人工智能答案，这样和写作业时直接扫题获得答案的学生有什么区别，这些写作业扫题直接抄答案的学生，自然也是对学习内容一概不知。当真正遇到问题无法依赖人工智能的时候，平时就依赖人工智能的他也就失去了自己解决问题的能力。

3. 无法确保正确性的答案

继续以《原神》游戏中的内容举例，须弥人往往对“虚空终端”中的信息深信不疑，因为对他们来说，虚空终端中的知识都是正确的。现在的ChatGPT与NewBing也是如此，它们给出的答案，大部分是正确的，但现在仍然无法确保答案的准确性。

虽然现在NewBing会在给出答案的同时，给出资料来源，但没有多少人会去验证自己不了解的答案。如果在获取答案时不用批判性的思维方式去质疑答案的正确性，那终究也会变成须弥人那样对“虚空终端”中的知识深信不疑，对错误的答案全盘接受。

不过，这样的思维方式放在日常学习或者生活中仍是必须的。网红、专家甚至科学家、国家给出的信息，都不一定是正确的，他们一样可能受到自身思维局限性的影响，就像过去人们不相信不接受日心说一样，我们应该时刻对接受到的信息保持怀疑态度。

4. 知识的解释权被掌握在大公司手中

在未来，NewBing这样的新时代的搜索引擎持续不断地发展，更多的普通人必然还是会像我上述所说的一样，逐步开始依赖人工智能给出的答案。那么人工智能给出答案的解释权，也终将会逐步被大公司所掌控。

GPT的研发训练成本异常巨大，这不是普通公司能够负担得起的，可以说全世界没有几家公司能够做出并持续运营这样的产品。他们完全可以依照自己的想法管理人工智能给出的答案，以此控制人们的思想，这样的未来是非常令人后怕的。

想象一下微软通过非常规的手段，控制NewBing给出的答案，让它给出“春节起源于韩国”并给出各种引用，对中国文化不了解的外国人，自然也不会对这份答案有所质疑，文化解释权也落到了他人手里。

当然事实可能不会这样演变，世界也可能会出台相关政策，但我们不得不对此有所准备。

5. 最后

我个人认为，无论是程序员，甚至扩大范围到普通从业者或一个普通人，对我们来说人工智能带来的对未来改变，必定是如同人类历史上“蒸汽时代、工业时代、信息时代”同等程度的“人工智能时代”，从历史来看，大时代的更迭一定会导致很多岗位会消失，也一定会催生更多的岗位，被淘汰的是跟不上时代的人，如何运用人工智能更好地服务于自己，积极迎接新时代，才是我们需要首要考虑的事。