人类无法感知理解的机器知识在爆发增长：4.5星|王维嘉《暗知识》

关于人工智能的科普。包括技术原理、商业应用的现状与展望、人工智能未来发展等方面。

作者在斯坦福的博士导师是神经网络鼻祖之一，书中对人工智能原理的介绍比较深入。

对人工智能的商业应用，书中花了比较多的篇幅说自动驾驶，看得出来作者在这个领域有比较深入的研究。其他许多领域如医疗、金融、翻译、科研、写作、绘画等也有介绍。

所谓暗知识，就是人工智能发现的、人类无法感知和理解的知识，比如AlphaGo的围棋决策。作者介绍说这类暗知识在爆发式增长，很快会对人类社会产生深远的影响。

书中还有以下重要的信息或观点：

1：暗知识非常容易在机器间传播；

2：未来AI需要用到的数据，大部分都不在当前互联网巨头们手里；

3：AI不会像互联网一样赢家"通吃"；

4：自动驾驶生态系统中，谁将是产业链龙头还有待观察，可能是芯片或操作系统企业，也可能是内容服务提供商；

5：即使自动驾驶局限在狭义的造车产业，也将会创造全球每年2万亿美元的机会；

6：一场最深刻的革命很可能发生在自然语言翻译和理解领域；

7：军用人工智能技术的发展会落后于民用技术；

8：很难对自动化武器的可靠性进行测试，会思考的机器的行事方式也可能会超出人类控制者的想象；

9：虽然人工智能在记忆和识别这两个基础智能方面超过了人，但在推理、想象等高级智能方面还和人相去甚远；

10：女性情感比男性丰富,所以比男性更难被机器取代；

11：不论是个人生活中的决策，还是商业决策，只要机器有过在类似场景下大量的测试，就可以信任机器；

12：目前人工智能离产生意识还有很大举例；

总体评价4.5星，非常好。

一个小疑问，书中的图4-2，AI的产业链金字塔结构，塔尖是基础，塔底是应用，有点别扭，改成树状把塔尖塔底倒过来更符合常规做法。

以下是书中一些内容的摘抄：

1：AlphaGo Zero证明了即使在最具有挑战性的某些领域,没有人类以往的经验或指导,不提供基本规则以外的任何领域的知识,仅使用强化学习,仅花费很少的训练时间机器就能够远远超越人类的水平。P7

2：当然最震撼的就是第三个方面。我们也许知道我们不知道很多,甚至能用逻辑推断出未知知识里有比已知知识更高深的知识,但我们怎么也想不到这些知识是人类根本无法理解的。这是人类历史上第一次遇到这样的问题,我们给自己造了个“上帝”! P9

3：也就是说,机器发现了人类既无法感受也无法表达的知识。用更通俗的话说就是,机器发现了那些既无法“意会”又无法“言传”的知识。P9

4：目前，脑神经科学的最新研究发现，可表达的记忆并不是对应着一组固定神经元的连接，而是大致地对应于散布在大脑皮层各处的一些连接。原因是用来表达的语言和文字只能是体验的概括和近似。这类可以用语言表达或数学公式描述的知识就是人类积累的大量"正式知识"，也可以称为"明知识"。它们记载在书籍、杂志、文章、音频等各种媒体上。P20

5：而绝大部分知识无法用语言表达，如骑马、打铁、骑自行车、琴棋书画，察言观色、待人接物、判断机会和危险等。这些知识由于无法记录，所以无法传播和积累，更无法被集中。英籍犹太裔科学家、哲学家波兰尼(Michael Polyani,1891-1976)称这些知识为"默会知识"或者"默知识"。波兰尼举了骑自行车的例子。P23

6：第三个问题最有意思。由于机器萃取出的知识是以神经网络参数集形式存在的,对人类来说仍然不可陈述,也很难在人类间传播。但是这些知识却非常容易在机器间传播。一台学会驾驶的汽车可以瞬间“教会”其他100万台汽车,只要把自己的参数集复制到其他机器即可。机器间的协同行动也变得非常容易,无非是用一组反馈信号不断地调整参加协同的每台机器的参数。P26

7：既然可以感受的是默知识，可以表达的是明知识，那么机器刚刚发现的，既无法感受也无法表达的知识就是暗知识。P27

8：我们现在可以回答“一个人类无法理解的暗知识的表现形式是什么样的”,暗知识在今天的主要表现形式类似AlphaGo Zero里面的“神经网络”的全部参数。P29

9：我们可以预见一幅未来世界的知识图谱：所有的知识分为两大类界限分明的知识——人类知识和机器知识。人类的知识如果不可陈述则不可记录和传播。但机器发掘出来的知识即使无法陈述和理解也可以记录并能在机器间传播。这些暗知识的表现方式就是一堆看似随机的数字，如一个神经网络的参数集。这些暗知识的传播方式就是通过网络以光速传给其他同类的机器。P31

10：暗知识就是那些既无法被人类感受又不能表达出来的知识。也就是说人类本身无法理解和掌握这些知识，但机器却可以。机器有两种方法可以掌握这些知识模仿人脑和模仿演化。P42

11：机器学习中一共有五大学派，最后一个学派是进化学派。他们是激进主义经验派，是彻底的不可知论者。进化学派不仅觉得因果关系是先验模型，甚至觉得类比，神经元连接也都是先入为主的模型。他们认为不管选择什么样的先验模型，都是在上帝面前耍人类的小聪明，世界太复杂，没法找到模型。进化学派的基本思路是模仿自然界的演化随机的基因变异被环境选择，适者生存。P43

12：所以这四个词有下面的包含关系：人工智能>机器学习>神经网络>深度学习。P46

13：为什么深度学习有许多层神经元?这是因为世界上许多信息和知识是可以通过分层表达的。例如人脸是很复杂的一幅图像，但人脸可以先分解成五官，五官的复杂程度就比人脸低了，五官又可以进一步分解为线条。深度学习就是用一层神经元去识别一个层级的信息。P62

14：引起你注意的东西往往都是一小块，例如人的眼睛、天空中的鸟、地上的花。这个叫作图像中信息的局域性。图像的第二个特点是可以分解为更简单的元素，例如风景分解为天空、大地、植物、动物，人物分解为五官。卷积神经网络就是利用图像的以上两个特点进行了大幅度的运算简化。P65

15：这类问题的特点是答案不唯一但知道结果的对错。这种通过每次结果的反馈逐渐学习正确"行为"的算法就叫"强化学习"。在强化学习算法中有一个"奖惩函数"，不同的行为会得到不同的奖惩。P76

16：以后哥俩就这么不断重复下去。AlphaGo Zero诞生后的第一局的第一个中盘，哥俩完全是乱下，但第一盘走完就多了一点点知识，哥俩用这点可怜的知识走第二盘就比第一盘靠谱了一点点，架不住计算能力强大，AlphaGo Zero在下棋时每秒钟可以走8万步，平均一盘棋不到400步，所以哥俩一秒钟相当于下200盘棋。每盘长进一点，到第7个小时，也就是相当于下了500万盘棋后就下得像模像样了。P77

17：所以对这个悖论的回答是，人工神经网络虽然是模仿大脑，但它具备了人类没有的三个优势能"感受"人类感受不到的信息，与人脑相比又快又准，每一个神经元的状态都是可测量的。P80

18：打比方说，如果一直用各个品种的白色狗来训练神经网络，让它学会"这是狗"的判断，神经网络会发现这些狗最大的相关性就是白色，从而得出结论白色=狗。在这种情况下，让这个神经网络看见一只白猫，甚至一只白兔子，它仍然会判断为狗。P86

19：神经网络的另一个局限性是无法解释结果为什么是这样，因为人类无法理解暗知识，所以更无法解释。对于神经网络这个"满是旋钮的黑盒子"，每个旋钮为什么旋转到那个位置，而不是多一点或者少一点，都是无法解释的。这个不可解释性在许多涉及安全和公共政策的领域都是很大的问题。P87

20：所以今天融资的新创技术型公司都可以说自己是"AI公司"。如果这些公司的技术都使用开源编程框架，它们的技术差别就很小。因此这些公司比拼的是对某个行业的理解和在该行业的营销能力，以及对该行业数据的占先和占有程度。P112

21：今天互联网公司的数据主要是人们使用电脑和手机产生的浏览数据，它们并不掌握下列几大类对人类有用的，AI也需要用的数据。(1)人类本身的数据，例如身体数据和心理数据。(2)环境数据，其中包括自然环境、社会环境。(3)各种人类劳动过程数据，例如农业、工业、服务业的过程数据。P118

22：自2012年以来，在AI训练运行中所使用的计算能力呈指数级增长，每3.5个月增长一倍。2012-2018年，这个指标已经增长了30万倍以上。具体说就是2018年谷歌的A1phaGo Zero比2012年ImageNet大赛获胜的AlexNet快了30万倍。P121

23：但在AI产业里目前还没有看到这样的机会，不论是自动驾驶还是人脸识别都是一个一个山头去攻，无法在短期内形成垄断。造成融资泡沫的一个重要原因就是有些投资人还以为AI和互联网一样赢家"通吃"，只要投中第一名，多贵都值。P125

24：简单用一句话说就是互联网是toC(对用户)的生意，AI是toB(对企业)的生意。AI中toC的生意都会被现有互联网巨头吸纳，创业者的机会在于toB。P125

25：激进派的代表是谷歌的自动驾驶公司Waymo，谷歌的实验车根本没有方向盘。这一派认为L2和L3很危险，什么时候该人管，什么时候该机器管不仅很难分清，而且两者之间的切换也会产生问题(例如人打盹儿睡着了叫不醒)，一步到位全让机器开车反而安全。P139

26：在传统汽车产业链中，整车厂商毫无疑问居于龙头地位，具有最强的砍价能力，但是在自动驾驶生态系统中，谁将是产业链龙头还有待观察。如果汽车嬗变为电脑和手机，那么掌握核心芯片和操作系统的厂商可能变为龙头。如果汽车嬗变为像互联网一样的信息数据平台，那么掌握用户的内容服务提供商可能变为龙头。P152

27：在这三个集团中，英伟达集团的AI芯片能力最强，但Mobileye集团几乎垄断了L2半自动驾驶市场。未来的争斗将主要在这两个集团之间进行。P153

28：即使自动驾驶局限在狭义的造车产业，也将会创造全球每年2万亿美元的机会。如果加上对其他行业的影响，自动驾驶产生的商业机会可能在十年后达到每年十万亿美元的数量级。自动驾驶将是中国今后10～20年面临的最大的一个全球性产业机会。P159

29：自动化写作无论是对新闻行业还是对读者来说，都带来了显而易见的好处。对新闻工作者来说，他们可以把程式化、重复化的劳动交给机器，自己进行更深度的思考与写作，并且在写作过程中能够得到人工智能的支撑，写作后有系统校对。P196

30：当所有人对AI的注意力都集中在诸如自动驾驶、人脸识别等"低垂果实"上时，一场最深刻的革命很可能发生在自然语言翻译和理解领域。这场革命可能改变自几十万年前智人发出第一声有意义的"哼哼"以来的人类文明史。人类有可能第一次无障碍地盖起一座“巴别塔”。P216

31：基于以上原理，机器学习适合做极其复杂的决策，例如制定像健康保险这样极其复杂的公共政策，策划诸如诺曼底登陆这样包含大量变量的军事行动。P228

32：由于开放性的学术交流和开源软件，民用技术将进展神速，巨大的商业前景也会造成空前激烈的市场竞争。这一切都会推动人工智能在民用和商用方面快速进展。而军用技术的发展则会落后于民用技术，许多军用技术研发最便宜的方法都是依托在民用技术之上。P251

33：自主化武器失控和错判的风险将一直存在，比如软件代码错误，或者受到网络攻击。这可能导致机器失灵或攻击自己人，或由于系统升级太快，人类伙伴无法及时响应。很难对自动化武器的可靠性进行测试，会思考的机器的行事方式也可能会超出人类控制者的想象。P256

34：但当谷歌让14台机器一起学习的时候，学习的时间就缩短到了100/14-7天。这14台机器都互相联网，当一台机器找对地方或学会了一个技能时，其他所有的机器瞬间都学会了。这种机器之间的交流不仅是无障碍的而且是以光速进行的。P258

35：简单地说，虽然基于神经网络的人工智能在记忆和识别这两个基础智能方面超过了人，但在推理、想象等高级智能方面还和人相去甚远。未来最佳的结合就是人类和机器合作，互相取长补短。P261

36：目前主要的成功案例来自一名叫作威廉姆·多贝尔(William Dobelle)的科学家。1978年,多贝尔在一位盲人的脑内植入了由68个电极组成的阵列,这种尝试使盲人产生了光幻视(视网膜受到刺激时产生的感觉)。在随后的调试中,接受这种治疗的盲人能够在有限的视野内看到低分辨率、低刷新率的点阵图像。P264

37：女性情感比男性丰富,所以比男性更难被机器取代。机器取代人的难易程度从易到难将是四肢(体力)——小脑(模仿性工作)——大脑(推理逻辑常识)——心(情感)。P278

38：那么这次的AI浪潮又会造成什么样的权力分配呢?在过去几年中我们明显看到AI进一步将权力集中到大公司和政府手中。P287

39：机器已经正确地诊断了许多其他类似的病人。所以不论是个人生活中的决策，还是商业决策，只要机器有过在类似场景下大量的测试，就可以信任机器。当然这里不排除机器出错的概率，这和不排除有经验的医生误诊，不排除大型客机的软件出故障一样。P288

40：目前的人工神经网络是一个确定性系统,虽然我们可以在网络里引人随机性,但是我们并不清楚在哪里和怎样引入这些随机性。这样的随机性有几乎无数的可能组合,任何“不对”的组合都可能使系统无法产生“涌现”。人脑是动物几十亿年进化的结果,其中淘汰了无数无法产生意识的随机组合。P295

全文完

人类无法感知理解的机器知识在爆发增长：4.5星|王维嘉《暗知识》

猜你喜欢