机器学习第五周笔记（神经网络）

神经元模型

M-P神经元模型

简单的说，神经元就是存放数据的一个存储单元
过程关键词：输入、权重、阈值、激活函数
在这里插入图片描述

激活函数

理想的激活函数是阶跃函数，但是数学特性不理想（在（0,1）点，不连续、不光滑、不可导），所以我们经常使用sigmoid函数来作为激活函数。
在这里插入图片描述

感知机和多层网络

感知机

简单的感知机模型：由多个神经元组成，包含输入与输出层。
在这里插入图片描述
感知机的学习能力有限，仅在线性可分问题上收敛，可以解决与或非问题，无法解决异或问题

多层功能神经单元

多层网络

多层的意思就是除了输入和输出层之外，还在中间引入了隐含层的概念。而且隐含层和输出层都拥有激活函数。
在这里插入图片描述

多层前馈神经网络

层级结构，神经元之间不存在同层连接，也不存在跨层连接。各层功能如下：
输入层：接受外界输入
隐含层：信号加工
输出层：信号加工+输出结果

优点：理想的多层前馈神经网络可以逼近任意复杂度的连续函数
未决问题：如何设置隐藏层的神经元数，在实际中采用“试错法”

神经网络的求解：BP算法（误差逆传播算法）

error BackPropagation网络

迄今为止最成功的的神经网络算法

主要参数

输入：d维特征向量xi
输出：l维输出值yj
阈值：输出层的第j个神经元的阈值记为θj，隐藏层第h个神经元的阈值为γh。（这里特别要注意，都是阈值，但是所在的层不同，他们的名字也是不用的）
输入层：d个输入神经元；注意第i个输入神经元和第h个隐藏神经元之间的连接权重为vih（注意v相当于输入级的权重）
隐藏层：q个隐藏神经元；注意输出层第j个神经元的阈值为θj，隐藏层第h个神经元的阈值为γh
输出层：l个输出神经元；注意第h个神经元的输出为bh
在这里插入图片描述

基本原理

通过学习确定基本参数，需要训练的参数包括权重值w和阈值θ，个数可以通过(d+l+1)q+l计算
学习策略：基于梯度下降策略，以目标为负梯度方向对参数进行调整。
调整方式：迭代 v += dv
在这里插入图片描述
经过一波推导（比较难，以后再看）之后，我们可以得到权重更新公式：

使用链式法则，我们可以展开：

我们按照如下的方法定义g，