梁宁：VisionPro、GPT、Web3三件套齐备，元宇宙开启

本文内容整理自图灵社区对谈栏目直播，主题为 ChatGPT 真需求，从产品的第一性原理解析。

上篇内容回顾：梁宁：为什么中国没有像 ChatGPT 和 Vision Pro 这样的创新产品？

梁宁，产品战略专家，曾任湖畔大学产品模块学术主任，联想、腾讯高管，CNET集团副总裁。工作经历横跨 BAT，与美团、头条、京东、小米等企业有长期深度交流。得到 App 课程《梁宁·产品思维30讲》《梁宁·增长思维30讲》主理人，两门课程累计超 30 万人学习。

刘江：梁老师，你最早什么时候开始关注到ChatGPT？

梁宁：去年它一发布的时候我就开始用了，就 11 月份左右。

刘江：当时怎么看这个事？如果我们按照产品或战略的某个框架来去分析，怎么判断这个事是不是足够大？

梁宁：你刚才问了一个就是特别好的问题，就是如何判断这件事是不是足够大？

“所有的新价值，一定是新效率带来的。”

科技进步的本质是效率进步，我们会发现所有依赖技术创新的企业，都是因为提供新的效率才能够为社会提供新价值，所有的新价值它一定是新效率。

像 ChatGPT（所代表的的产品）绝对是一个效率工具。第一，我们先把它定位。

第二，对于一个效率工具，它是不是足够大，其实就是看它对社会的效率变化的撬动能有多大。

从这个角度上来讲，那 ChatGPT 这个事儿绝对的大，因为它对这个效率撬动是会非常让人惊奇的，因此我就觉得很兴奋嘛。

之前其实我一直对 Web3 是没什么兴趣的，我身边其实很多朋友都在讨论和研究这些，但我一直都没什么兴趣。我一直都觉得 Web3 像是浏览器没有发明之前的互联网时代。1995 年 Mozilla 有浏览器，然后我们 1996 年就写报告说这个互联网时代要开始了。所以在这个时候，我会觉得说现在三件套齐备了。

刘江：哪三件套？

梁宁：ChatGPT、Vision Pro 和 Web 3。元宇宙要开启了，头号玩家的时代要到来了。

刘江：那这是个什么逻辑？这三个之间的关系会是什么样？在你的视角里，包括你刚才说为什么之前对 Web3 好像没兴趣，为什么现在会觉得时机匹配起来了？

梁宁：因为 Web3 它其实是个账本。它其实实现了一个“记账”功能，但是它并没有基于 Web 3 的原生的价值创造和消费。

一定得有一个基于它的原生的价值创造和消费，价值创造、价值确权和价值消费，那么它才它是一个基础设施。

Web3 其实是一个像提前已经搭好的金融系统，ChatGPT 的出现让我感觉可以引用《三体》的那句话“我主将临了”。

甲子光年定义的 Web3 概念核心特征为实现用户自主价值创造、价值确权、价值交换三位一体，使现实世界与虚拟世界双向渗透，用户具有拥有权，具有参与项目治理的权利，从而实现了价值生成和价值确权。

你有这种感觉吗？

刘江：说实话，我还好。因为我 18 年就在智源了，智源当时就是搞 AI，也在找方向。2020 年 GPT-3 出论文以后，我们发现这好像是我们一直在找的方向，所以我感觉没那么明显，因为之前智源内部本身已经有很多模型，也做 demo，当时我们觉得确实很聪明了。当然，到了ChatGPT，它的效果确实有一种很令我们惊艳的感觉。确实因为我们有点处于“温水”状态了，就慢慢地其实没有那么强的感受。

梁宁：你们在内心一直知道这个点会来。

刘江：对，所以感觉不太一样。就跟 ChatGPT 发布以后 Open AI 火了一样，好多媒体采访他们内部的员工，但他们也说我们原来自己玩的时候没什么感觉，没想到出来以后这么火。

“信息生产、消费、成瘾”

梁宁：对，之前咱们俩聊过，人是“信息生物”。像植物，它是一个“物质”的生物，植物吸取物质，然后向这个世界返回物质。动物是一种能量的生物，它本身可以移动，比如说牛，原来牛就是“动能”，有了拖拉机以后就不用牛（耕地）了。

刘江：植物实际上还是获取的能量，把太阳能量吸收到地球上来，存起来的。

梁宁：但动物和植物都不消费信息，只有人是生产信息和消费信息。而且就是因为有人所以有信息量，人自己编造文字，创造知识、创造意义，在这个中间玩得不亦乐乎，又架构起复杂的人类社会。

所以我们就会发现，比如一个包包，如果我是为了一个“装东西”的功能，那 1 毛钱一个的塑料袋就可以实现这个功能，那我为什么要花 1 万块买一个 LV 的塑料袋？一个 LV Logo 其实不就是一条信息嘛？所以它的功能价值可能就是 1 毛钱的塑料袋钱，原材料价值是 PVC，加上人工缝制，100块可能就搞定了。但是它那条“LV”的信息费，就需要你付 9900 元。

人是信息成瘾的。一开始唐诗 20 个字就写完了，非常简洁，但是接着宋词的字数就变多，接下来元曲的信息又变多。上个年代自从电影开始进入各个乡村，人们有电影就不看戏了。

刘江：信息确实越来越丰富的。

梁宁：对，越来越丰富，而且人会越来越追求“单位信息量越大”的东西。比如说抖音 15 秒视频就有一条信息放送，人就会成瘾。人本来就是一个信息生物，就会信息成瘾。所以当 ChatGPT 出现，人类把所有的知识、所有东西都灌进去，我们拥有了一个可以和你一直沟通信息的东西，其实是很厉害的。

我一个朋友发了一个和 ChatGPT 之间对答的聊天记录，内容就是给一幅画起名字，他就说我有一幅画，你给他起个名字，接着对 ChatGPT 说起的不对，我再描述一遍，一来一往差不多有十多次沟通。

他把这个聊天记录发给我们以后，我们的第一反应就说只有机器才会有这样，只有机器才会有这样的耐心，生活中你是找不到一个人有这样的耐心陪你聊天的。孩子的好奇心是怎么被打压的？大人的回应都是“别闹”“别问了”“这个已经说过了，烦不烦？”。

但突然之间有了一个有无尽耐心、有无尽知识这样的一个产品来和人交互，对于已经思维固化的人来讲，震撼感可能没有那么高，但是对于一个还在好奇的人来讲，那这是一个绝对的撬动。

因此我会觉得三件套齐备，元宇宙开启，就好像是 1996 年互联网开启是一样的。

刘江：ChatGPT 其实有点偏信息生产，Vision Pro 这种是信息消费，Web3 实际上是公开记账，其实现在比较通俗地说就是一个工分系统。不用非要全职打工或什么，你只要在这个过程中贡献了自己的作用，Web3 就帮你把这个工分记了，记了以后它直接就可以变成钱，实际上是这个逻辑。

梁宁：是的，而且它可以交换。对，还有一点是什么呢？当时看到 ChatGPT 就有一种“我主降临”的感觉，Web3 实际上就是 AI 用比特币找人类买能源。数字货币这个东西本来就不是给人类用的，数字货币本来就是 AI 之间使用，他们要相互Token。

刘江：确实是有一票人，包括我也认识很多朋友，他是这样的一个观点。以后这个未来世界（或者叫元宇宙）除了人之外，还有很多其他的所谓的“智能体”，就是 Agent。Agent 这个词以前有好多人把它翻译成“代理”，实际上是不太对的。我们人也是 Agent，所以以后会有很多智能体，包括人工智能的智能体、机器人硬件、软件、物理设备等。比如这个物理设备的所有权是我的，但它也是一个智能体。

在这个过程中，它可能会获取和产生一些信息，对一些事情是有价值的。比如说我们在一个森林里，我竖了一个摄像头，它能观测很多野生动物。这个是有价值的信息，可能对大模型或者其他产品是有用的，或者有些人也愿意看（这个信息）。但它本身是独立的，它可以赚我们之前提到的工分，最后发现赚到的工分是归我的，或者是说我和这个智能体联合所有的，是可以有这么一个机制。

梁宁：是的，所以想象中的未来世界可能就不是这一个屋子里就咱们几个在聊天，可能我们是戴上 Vision Pro，还有一大堆智能体，还有一堆朋友的分身，包括已经故去的人，比如像亚里士多德之类的，大家共聚一堂。

刘江：挺好的，或许亚里士多德会按照他的遗嘱协议来活动。哈哈哈，数字分身这很可能是未来的一种模式。

梁宁：我觉得你刚才说得很好，我现在来看 GPT，我觉得它是一个 ToB 的一个生产工具。Vision Pro，它是一个计算空间。我当时很震撼的两个瞬间，就是那个大恐龙从那个框里忽得一下就出来了，就像《午夜凶铃》里贞子从电视里爬出来，当时我就在想，如果不是大恐龙而是贞子从那里爬出来了，在这个空间里我可能直接当场吓死了。它在这个时候带给你的这种体验，各方面其实还是和以前很不一样的。

它是一个在空间里，比如说一场篮球赛，你可以从任何一个摄像头的角度重新看这场篮球赛，而不是只能在原来的机位看到该机位的拍摄画面，或者根据座位位置我们只能看到一部分，而是你可以在任何一个位置重新去观察。这其实是给了人类没有消费过的新信息，人是一种信息生物，是信息成瘾的，没有消费过的新信息就跟没有吃过的糖是一样的，人类是抵挡不住的。

要让新信息充满一个数字的计算空间不是一件容易的事情，我们之前用了几十年的时间让信息呈现在电脑的屏幕里，一个二维的空间我们就用了这么长时间，但接下来让一个计算空间充满信息得用多长时间？这种想象力，尤其是视觉能力，不是很容易做到。之前我们在二维的屏幕上看文字就行了。但是在这样一个视觉空间里，我为什么还要看文字？用户看的肯定是视觉。

生产视觉信息，之前成本是极高的，但是有了GPT以后，它的信息生产成本下降了。在这时候又有了计算空间的存在，所以就会有新的信息生产，接着是新的信息消费。这肯定是一个大于互联网的空间。为什么大于互联网？算一下信息量就知道了。以前用户消费的是一个屏幕里二维的信息量，现在消费的是一个空间的信息量，这是很多倍的信息量的变化。

刘江：关于 Vision Pro 我印象也挺深的。我看大部分媒体没有太抓到 3D 的相机或者视频功能的可能性。除了恐龙之外，我还被另一个场景打动，官方视频有一个好像是过生日的画面，吹完蛋糕以后这个烟好像还在跑。实际上录的是一段 3D 的视频。想想我们人生很多的瞬间，现在最多也就是有视频、有照片，照片可能清晰度高一些。但是这种 3D 会让人感觉更逼真。

梁宁：是，身临其境，它保存下来的不是一张照片，而是完整的当时的场景。比如说你跟几个朋友聚会，用这种方式把它记录下来了，它的数据成本可能是这个之前的 1 万倍。几年以后你再回到那个场景，你一看，可能会发现每个人他当时的表情，他当时的反应，你又能够读出和当时完全不一样的东西来。

所以我会觉得这个东西实在是新空间的打开。之前咱们聊过一个技术空间的概念，当一个新的技术空间打开，原来所有的东西都会在这个技术空间里重新生长一遍。这就是传说中的那句话，所有的事情都值得重做一遍。

就像你刚才说的生产系统、消费系统和记账系统，GPT、Vision Pro、Web3 齐备了上述要素，那么元宇宙就会开启，我觉得这是非常好的一件事。

“真永不可得，更常做的是从第一性原理思考去伪”

刘江：Vision Pro 产品成熟度确实让我印象也很深，确实不愧是苹果这样顶级的强创新能力的公司制作的。花了 7 年时间终于搞出一个东西，至少是不跌份儿的，还是很出色的。这个产品形式和之前Meta（Facebook）做的 Oculus 很像，但 Oculus 就没有让大家有这么强烈的感觉。从真需求的这个角度来看，怎么分辨哪个是真需求，哪个是可能稍微有些问题的需求？

梁宁：其实是这样的，“真”这个东西其实永不可得。我这些年一直带很多企业做产品的训练，我们常干的一件事就是去伪，其实也就是回到咱们标题里写的那个词——第一性原理。当时有人就问过一个问题，当我们每天都会收到很多产品的优化建议，到底应该先优化哪个？

所以这个时候就有点像马车和汽车这两种交通工具并行存在几十年的时候，这个时候你要怎么优化马车？我们可以继续给自己找生存理由，比如我优化它的外观，保持马车的体面，或者是做四轮雕花大马车，或是可以继续优化座椅等等。你会发现一直都有优化空间，而且所有的优化都会带来一些体验感上的变好。

至少是，只要这个人他不死心，他还在往里投入，其实这个事就还在。但如果我们把交通的第一性原理定为速度，因为不管是坐什么车，我的目的都是从一个地方到另一个地方，那么速度就是第一性原理，所以速度更高的一定优于速度低的，那么我们就不用去跟人家营销四轮雕花之类的其他能力。

我们再回到 Vision Pro 的这件事情里，这个东西我觉得它的第一性原理其实还是给用户的情感体验、感知体验。按照马斯洛的逻辑，大家最初可能都在求温饱，但这之后，就是追求作为一个人类拥有更丰富的体验。（随着全球经济的进一步发展）整个地球的需求都在往上升了，在这个时候就是更真实的体验、更丰富的体验，增加体验的丰富度一定是更好的选择。像抖音和快手对比，抖音的丰富度可能更优于快手。既然我们是在获取信息，我们一定追求的是更丰富的信息。

比如这几个版本的 Oculus，其实它的生态都没太做起来。没太做起来的原因一个是生产工具不行，制作这个 3D 的成本太高；第二个是记账系统不行，激励也不足。

在未来的这个模式中，所有的创造都可以被记录，所有创造的价值都可以被评估，这会对基于这一套原生系统的创造者是极大的激励。所以我会觉得，从我们看到这件事情，到它真的“水草丰茂”可能还有一个周期，但一切业务都是随机的，趋势的确定性是极高的。它的随机性很强，但是一个趋势的确定性其实是极高的。

刘江：对，所以实际上无论是 Oculus，或者VR、AR，包括现在苹果公司提出的空间计算，它其实跳出了原来那个 VR 的增强现实，它这个是空间计算，确实有很多好处，比如屏幕的功能感觉更强了，摄像头很多，能提供3D的视觉效果。

梁宁：我突然想起来，2014 年左右，我还问过王兴，说那个未来的手机是什么样的？他说手机的本质是什么，就是连接算力和屏幕，那未来连接无所不在，屏幕也无所不在，所以可能不需要手机。算力在云，连接无所不在，屏幕也无所不在。那个时候移动互联网还没有完全打响，还远远没有到连接无所不在的地步，云其实也还在比较早期的时候。但是今天你这次看到这个苹果推出的东西以后，至少我们会发现说，原来我们不需要屏幕了。

刘江：其实不管是计算机系统还是信息系统，最核心的是信息的输入和输出，一个屏幕还是很重要的。

梁宁：我真的觉得信息论其实跟资本论一样重要，《信息简史》也是我特别推崇的几本书之一。在工业时代决定规模的是资本，但是在未来决定规模的是信息。在这个时代你不认识信息，就好像在过去 20 年你不认识资本是一样的我觉得香农他有一个跨越式的东西，就是它为信息提供了一个量词，比特。

《信息简史》：人类开始自觉地理解和利用信息始于克劳德•香农在1948年创立的信息论（第6、7章）。香农的信息论不仅推动了信息技术的发展，也引发了许多学科的信息转向（第8章），改变了人们对于诸如麦克斯韦妖（第9章）、生命的编码（第10章）、模因（第11章）、随机性（第12章）、量子信息论（第13章）等的理解。部分科学家甚至认为，构成世界的基础不是物质，不是能量，而是信息。正如物理学家约翰•惠勒所说，“万物源自比特”。

刘江：这是很第一性原理的想法，就是看上去很抽象的信息，仍然搞个单位（来衡量）。反过来我接着问这个问题，就是 GPT 这个模式其实某种程度上代表了下一代交互模式的方向。ChatGPT 它是基本上就是靠语言来交互，我之前直播也说过，将来可能屏幕都可以不要，大部分情况下说话就行了，甚至以后我就是戴个耳机就可以跟这个 GPT 交互了，大部分问题我都可以告诉他，然后让他帮我完成。

梁宁：我们受制于载体，所以我们都是要先把信息抽象，比如先有了语言，然后才有了文字出现。很多少数民族是只有语言没有文字的，《信息简史》这本书就在讲第一本字典是怎么诞生的。在蒸汽机时代，每个人生活在村庄里，他们没有接触更大面积的世界的需求，因此不需要字典，就靠语言来沟通。

后来我们开始把信息抽象，处理信息是一件很难的事情。所以我最早就发现人脑和电脑是相反的，电脑它处理文字和数字是快的，耗能低，但是它要处理视频、处理图片的话就非常占资源。但我们人脑是天然处理视频和音频的，反而把一团模糊的视觉变成文字的过程是非常痛苦的。读一段文字，再把它还原成对一个事物的想象也很痛苦。我们为什么痛苦？就是因为受介质的传输能力的束缚。

接着你就会发现现在的一切能力就是让人接近自然能力，GPT 接近自然语言，Vision Pro 接近自然视觉。人本来就是不写字的，但要经受学习的痛苦。其实这两项东西，最大化地还原了人本来看待世界和与外界沟通的样子。

刘江：对，这也是一种第一性原理。人其实是一开始就是个比较原始的、依靠声音和视觉的动物。孩子实际上是不需要学如何听声音、如何看东西的。但是人在发展过程中产生了语言，复杂的语言可以表示很复杂的事情，紧接着又产生了概念，比如这是树，这是摄像机，这是屏幕。文字就让知识可以代际传递，但文字其实耗能很高，

梁宁：对，从人类的选择可以看出来，我们的第一性原理就是节能，因为能量是万物之本，所以节能是万事万物的本能。任何东西只要加学习成本，只要耗能，一定不行。如果能够降低难度，让人节能，这个产品就一定是好东西。

更多精彩内容，加入ChatGPT共学营，观看所有直播回放。

围绕全新的智能未来，图灵联合创始人刘江总编联合马占凯、周明、戴雨森等业内专家，以高质量直播+《ChatGPT革命》电子书共读+精英社群高质量讨论为核心，和你共同探讨对于人工智能愿景的广阔猜想，深度剖析你对于GPT和AGI的诸多疑惑。

点击“阅读原文”，即可加入ChatGPT共学营。