5.1 神经元模型
神经网络的定义:神经网络是由具有适应性的简单单元组成的广泛并行互联的网络,它的组成能够模拟生物神经系统对真实世界物体做出的交互反应。
模型结构:
MP神经元模型,神经元接收到来自n个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,神经元接收到的总输入值将与神经元的阈值进行比较,然后通过“激活函数”处理产生神经元的输出。下图形象地表现了这个模型结构:
激活函数:
- 理想激活函数是阶跃函数,0表示抑制神经元而1表示激活神经元
- 阶跃函数具有不连续、不光滑等不好的性质,常用的是Sigmoid函数
5.2 感知机与多层网络
感知机学习规则:对训练样例(x,y)若当前感知机的输出为,则感知机权重调整规则为:
其中称为学习率
若感知机对训练样例(x,y)预测正确,则感知机不发生变化;否则根据错误程度进行权重的调整。
多层前馈神经网络
定义:每层神经元与下一层神经元全互联,神经元之间不存在同层连接也不存在跨层连接
前馈:输入层接收外界输入,隐含层与输出层神经元对信号进行加工,最终结果由输出层神经元输出
学习:根据训练数据来调整神经元之间的“连接权”以及每个功能神经元的“阈值”
多层网络:包含隐层的网络
5.3 误差逆学习算法
本节将以以下的神经网络模型作为例子进行讲解。
给定条件:
- 给定训练集,即输入示例由d个属性描述,输出l维实值向量。
- 该网络包含d个输入神经元,l个输出神经元,q个隐层神经元。
定义参量:
- :输出层第j个神经元阈值
- :隐含层第h个神经元阈值
- :输入层与隐层神经元之间的连接权重
- :隐层与输出层神经元之间的连接权重
- :当前样本的输出
- :输出层神经元的梯度项
- :隐层神经元的梯度项
- :隐层第h个神经元的输出
学习目标:
确定网络中共计个参数,包括:
- 输入层到隐层的个权值
- 隐层到输出层的个权值
- 个隐层神经元的阈值
- 个输出神经元的阈值
几个重要公式:
- 计算神经网络的输出: ->1
- 输出层神经元梯度项计算公式:->2
- 隐层神经元梯度项计算公式:->3
- 目标参数的更新公式:、、、->4
计算方法:
参数优化:
BP是一个迭代学习算法,在迭代的每一轮中采用广义的感知机学习规则对参数进行更新估计,任意的参数w的更新估计式为:
学习策略:
BP算法基于梯度下降策略,以目标的负梯度方向对参数进行调整。