ML&AI-20:机器学习的理论基础

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/shareviews/article/details/82834218

ML&AI-20:机器学习的理论基础

一起创作,Come on!!! 简练而全面的开源ML&AI电子书

第二次世界大战之后,美苏在全维度展开了霸权竞赛,人工智能研究伴随着计算机的发展也开始进入佳境。经过经过半个多世纪的发展,人工智能逐渐形成:符号学派、贝叶斯学派和联结学派三个流派。
符号学派:以谓词逻辑表示法理论为基础的符号主义占据了绝对的主流,但是到了上世纪90年代,符号主义具有的先天缺陷开始暴露出来(没有自我学习能力)。
贝叶斯学派: 贝叶斯学派致力于寻找逻辑和概率的关系,利用概率分布进行有效推理。马尔科夫链和贝叶斯网络是他们的主要理论武器。贝叶斯学派在语言识别等子领域表现还是非常出色的。参考Sari和Google语音搜索利用隐马尔可夫链的论文。
联结学派:试图仿效人脑的结构和工作方式,以期获得相同或相似人脑的功能。借鉴神经科学,连接主义学派创立了神经网络。神经网络无论从原理还是工程实践来看,和人脑还无法相比拟。和符号主义采用数学方法不同,以神经网络为代表的连接主义采用了仿生学原理,利用硬件或者软件模拟出神经网络的连接机制,相对比符号主义,这种方式更加符合生物学事实。神经科学是神经网络的理论支撑,失去神经科学,神经网络也只能实现聚类和分类的角色,和完美的智能就无缘了。联结学派借助深度学习和计算能力的突破,目前在各类人工智能竞赛中大放异彩。

AI的终极目标是实现类人脑智能,神经科学是研究类人脑智能的钥匙。探索智能、意识的人脑机理,认识人的行为和情感,创新脑疾病诊断与治疗,是二十一世纪科学的前沿领域。脑科学和神经科学的发展极大的推动了神经网络计算的发展。当前新一代信息技术产业很关注对于大脑功能和神经网络的研究,希望机器具有更好的智能而不是野蛮的存储和计算能力,希望机器具有类人脑的工作方式而不是简单的数据总线结构。

1 计算神经科学的背景

从神经科学发展处第一代感知机,再到卷积神经网络,再到深度学习,深度学习成为类脑人工智能的最佳实践。深度学习的理论来源于神经科学家对大脑视觉系统的研究,人类的大脑的视觉系统是分层的,低层级神经元识别基础模式,中级神经元识别高级模式,高级神经元识别抽象模式。人们对视觉注意力、抉择、学习等认知功能的大脑神经网络机制的研究方兴未艾。发展脑科学基础研究,将促进“深度学习” 等类脑智能技术的蓬勃发展。

大脑是自然界造物主的终极杰作,近年以类脑计算、人工智能和脑机接口为突破口,为人类认识大脑开创了新纪元。计算神经科学也是脑科学与人工智能两个领域之间的必要桥梁,这些领域的互动和协同创新将极大推动未来的信息科技、脑科技以及下一代超级计算机的发展。

人类的大脑是个未知的黑箱,目前还没有形成系统的理论解释人脑的运作机制,我们对大脑的认识还远远低于我们对宇宙和地球的认识。目前类人脑研究百花齐放,各种跨学科的理论和模型都被应用于人脑机制的研究上。目前神经科学研究和信息科学结合尤为紧密,出现了类脑计算、人工智能和脑机接口等巨大进展。人脑的未知黑箱,就像具有包含巨大数量的未知变量的黑箱,需要新颖和复合的思路才可能找到钥匙。我们需要利用物理学、数学的方法研究上千亿神经元组成的复杂结构及其非线性动态行为;需要用理论和数学模型从基因、到神经元、到神经网络、到脑系统的多个层次来研究,以解释认知功能;需要用新的信息科学的工具分析和解读实验中获得的海量数据;需要用生物医学工程的技术来制造脑机接口,使脊髓损伤和运动残疾的病人能够用脑电信号控制智能假肢。

2 生物神经网络基础

联结学派的人工智能,理论和模型借鉴于生物神经网络。生物神经网络的重要研究进展都会展现在联结学派的理论模型中。联结学派的人工智能主要借鉴了生物神经网络的神经元理论,视觉皮层分层理论和稀疏理论等。

2.1 分层理论

1959年,Hubel和Wiese教授对猫的大脑纹理皮层进行了研究,并提出一种基于视觉皮层的分层结构模型,随后分层模型被广泛用于分类和识别任务; 在1999年,M.Riesenhuber和Tomaso Poggio提出了一种基于视觉感知机理的视觉特征计算的标准量化模型,为这一领域的研究注入了新的灵感。神经科学家Tomaso Poggio发现了视觉皮质是层级体系的工作原理,被划为为V1、V2、MT和V5区域,V1识别物体的基本线条和初始形状;V2识别物体的轮廓,残差和定位等;更好层级识别物体的抽象概念;层级体系中,信息双向流动,信号包含刺激信号和抑制信号。受生物视觉皮层分层模型的启发,各类基于卷积和分层的分类和识别器先后涌现,应用范围包括:手写识别、生物身份认证、DNA序列分析、化学气味识别、药物分子识别、图像理解、 人脸识别、表情识别、手势识别、语音识别、信息检索、数据挖掘、信号处理等领域。

2.2 稀疏理论

我们使用眼睛观察周围环境,在某些情景中我们相当投入,比如和心爱的人在星巴克聊天喝咖啡,即使我们调用所有的脑细胞去记住每帧精美的画面,最后落入我们记忆中的却是关于我们视觉区兴趣点的轮廓和提示。我们大脑如何存储我们如此着迷的精美视频切片呢?加州大学伯克利分校的分子细胞生物学教授弗兰克.韦伯林(Frank S.Werblin)的研究表明:视觉神经携带10-12个输出通道,每个仅携带少量关于给定画面的信息,其中一组名为神经节细胞的只传送关于相反的边缘对比变化的信息;另一组只探测画面的均匀颜色;第三组只能检测焦点图像之后的背景信息。
Frank S.Werblin认为“尽管我们认为自己看透了世界,但是我们接收到的却只是提示,是空间和时间的边缘,这12副图像组成了我们对外界所知的所有信息,借助这12副图像,我们重构了丰富的视觉世界,我们非常好奇,大自然如何选择这12幅简单的影像以及他们如何做到为我们提供所需要的全部信息”。
这种数据简化就是人工智能领域的“稀疏编码”(Sparse Coding)。我们发现创建一个人工系统时发现,抛弃大多数输入信息,仅保留最显著的细节,却颇有成效。然后大脑皮质的加工信息的能力却被我们选择性忽略了。

图像稀疏特性的扩展思考

扩展思考A: LeNet神经网络,底层模型表现出来的图像信号的稀疏性。
扩展思考B: H264编码中,底层模型表现出来的图像信号的稀疏性。

3 数学基础

人工智能综合利用交叉学科研究类人脑问题。数学是人工智能必不可少"瑞士军刀", 其中关系紧密的几个数学理论是:概率论、信息论、矩阵理论和数值计算理论。

3.1 概率论

概率论详见2.1

3.2 信息论

信息熵编码详见2.2小节

3.3 矩阵理论

矩阵理论详见2.3小节

3.4 数值计算理论

数据计算理论详见2.4小节

参考文献

  • [1] Ian Goodfellow, Yoshua Bengio. Deep Learning. MIT Press. 2016.
  • [2] 焦李成等. 深度学习、优化与识别. 清华大学出版社. 2017.
  • [3] 佩德罗·多明戈斯. 终极算法-机器学习和人工智能如何重塑世界. 中信出版社. 2018.
  • [4] 雷.库兹韦尔. 人工智能的未来-揭示人类思维的奥秘. 浙江人民出版社. 2016.

猜你喜欢

转载自blog.csdn.net/shareviews/article/details/82834218