神经网络学习——BP神经网络笔记 - 代码天地

神经网络学习——BP神经网络笔记

其他 2018-10-06 10:50:07 阅读次数: 0

神经网络学习，又叫做神经网络的训练算法，可以通过计算和更新神经网络本身的权值和阈值，加强网络自身的学习能力。

一.神经元模型

神经网络最基本的模型就是神经元模型，也是神经网络中的简单单元。神经元常用的简单模型是M-P神经元模型，如下所示：

阈值：就相当于神经元的兴奋电位，当这个神经元的输入电位 $\sum xiwi$ 大于这个神经元的阈值时，它就会被激活，向其他神经元发送电位，所以输出 $y=f(\sum_{i=1}^{n}wixi-\theta )$ ,而函数f表示的是一个激活函数，它将函数的输出值挤压到（0,1）的范围之内，函数图像如下

其他常用的也有符号函数什么的，不过不够光滑。

为了简化表示，通常我们把阈值 θ记为 −w0，并假想有一个附加的常量输入 x0=1，那么我们就可以把神经元的输入记为 ∑ni=0wixi 或以向量形式写为 w⋅x，把输出记为 y=f(∑ni=0wixi)。

把许多个这样的神经元按一定层次组合，就得到一个神经网络。

二.感知机

感知机由两层神经元组成，输入层接受外部信号后传给输出层，输出层就是M-P神经元，亦称“阈值逻辑单元”，由阈值的大小将输入的数据分为多种逻辑组合。感知机的激活函数 ff 就是之前介绍过的阶跃函数，因而我们可以把感知机函数写为

$y=sgn(w*x)$

y=sgn(x)就是我们熟悉的符号函数。还可以把感知机看作是 n 维实例空间中的超平面决策面，对于超平面一侧的实例，感知器输出 1，对于另一侧的实例输出 0，这个决策超平面方程是 w⋅x=0。那些可以被某一个超平面分割的正反样例集合称为线性可分(linearly separable)样例集合，它们就可以使用感知机表示。

所以，给定训练集，感知机的权重wi和阈值 $\theta i$ 就可以通过学习得到。由上述可以阈值也可以当做一个-1w0的权值，所以学习过程就可以统一为权值的学习。学习规则非常简单，对训练样本(x,y)，若当前感知机输出为 $\check{y}$ ，则调整公式如下：

$wi=wi+\Delta w$

$\Delta wi=\eta (y-\check{y})xi$

其中， $\eta$ 为学习率，若感知机预知正确，则 $\Delta wi=0$ ，感知机不发生变化，否则将根据错误的程度进行权重调整。

从上面的知识知道，感知机只有一层功能神经元（所谓功能神经元，就是有阈值的神经元，输入层是没有阈值的），学习能力差，只能解决线性问题，甚至不能求解异或这样的非线性可分的问题。

要解决非线性可分的问题，需要使用多层功能神经元，所以在输入层和输出层之间通常会加入一层或多层隐含层，隐含层和输出层都是具有激活函数和阈值的功能神经元。更一般的，常见的神经网络是如下图所示的层次结构，神经元之间不存在同层连接，也不能跨层连接，这样的神经网络通常被称为多层前馈神经网络。

单隐层的神经网络是最常见的神经网络，我们的BP神经网络就是这种。已经证明，只需一个包含足够多的神经元的隐层，多层前馈神经网络就能以任意精度逼近任意复杂度的连续函数，虽然我不知道也不关心怎么证明的，然而个数的设置仍是未解问题，还得靠试错法调整。

三.误差逆传播算法——BP算法

这是一种典型的有导师指导的学习算法，基本思想就是对一定数量的样本对（输入和期望输出）进行学习，即将样本的输入传入送至网络输入层的各个神经元，经隐含层和输出层计算后，输出层各个神经元输出对应的预期值，若预期值与期望的输出之间不满足误差精度要求，则从输出层反向传播该误差（注意传播的是误差），并通过权值和阈值的修改公式进行修改，使得整个网络的输出和期望输出的误差不断减小，直到满足精度为止。

也就是说，BP网络是将网络的输出与期望输出间的误差归结为权值和阈值的过错，反向传播将误差分摊给各个功能神经元，权值和阈值的调整也要沿着误差函数下降最快的方向——负梯度方向进行调整，调整公式就是重中之重。

给定一个样本矩阵， $X=[x1,x2,....xm],Y=[y1,y2,......ym]$ ，并且有一个拥有d个输入神经元，l个输出神经元，q个隐层神经元的多层前馈神经网络结构，输出层第j个神经元的阈值

为 $\theta j$ ，隐含层阈值为 $\gamma j$ ；输入层与隐含层的神经元连接为 $Vih$ ，隐含层与输出层的神经元连接为 $Whj$ ，则隐含层第h个神经元的输入为

$\alpha _{h}=\sum_{i=1}^{d}VihXi$

输出层第j个神经元接收到的输入为

$\beta j=\sum_{h=1}^{q}W_{hj}b_{h}$

Bh为隐层第h个神经元的输出。对训练例（xk,yk），假定神经网络的输出为 $\check{y_{k}}=(\check{y_{1}},\check{y_{2}},.......\check{y_{l}})$

即 $\check{y_{j}^{k}}=f(\beta _{j}-\theta _{j})$

则网络在（xk,yk）上的均方误差为

$E_{k}=\frac{1}{2}\sum_{j=1}^{l}(\check{y}_{j}^{k}-y_{j}^{k})^{2}$

这个就是我们要缩小和反向传播的误差值，BP是一个迭代学习算法，在迭代的每一轮中采用广义的感知机学习规则对参数进行更新和评估，所以，任意参数的更新公式都为

$v=v+\Delta v$

BP算法基于梯度下降策略，以目标的负梯度方向对参数进行调整，对误差Ek,给定学习率 $\eta$ ，有

$\Delta w_{hj}=-\eta \frac{\partial E_{k}}{\partial w_{hj}}$

注意， $w_{hj}$ 先影响到第j个输出层神经元的输入值 $\beta _{j}$ ，再影响到其输出值 $\check{y_{j}^{k}}$ ，然后影响到Ek，这就是整个误差逆传递的过程，有

$\tfrac{\partial E_{k}}{\partial w_{hj}}=\tfrac{\partial E_{k}}{\partial \check{y_{j}^{k}}}\cdot \frac{\partial \check{y}_{j}^{k}}{\partial \beta _{j}} \cdot \frac{\partial \beta _{j}}{\partial w_{hj}}$

而

$\frac{\partial \beta _{j}}{\partial w_{hj}}=b_{h}$

且

$f{}'(x)=f(x)(1-f(x))$

所以有

$g_{j}=-\frac{\partial E_{k}}{\partial \check{y}_{j}^{k}}\cdot \frac{\partial \check{y}_{j}^{k}}{\partial \beta _{j}} =-(\check{y}_{j}^{k}-y_{j}^{k})\cdot f{}'(\beta _{j}-\theta _{j}) =\check{y}_{j}^{k}(1-\check{y}_{j}^{k})(y_{j}^{k}-\check{y}_{j}^{k})$

所以联立几个式子，有

$\Delta w_{hj}=\eta g_{i}b_{h}$

类似的，所有阈值和权值的更新公式都可以由上述的近似方法得到，有

$\Delta \theta _{j}=-\eta g_{j}$

$\Delta v_{ih}=\eta e_{h}x_{i}$

$\Delta \gamma _{h}=-\eta e_{h}$

其中，

$e_{h}=-\frac{\partial E_{k}}{\partial b_{h}}\cdot \frac{\partial b_{h}}{\partial \alpha _{h}}$ $=b_{h}(1-b_{h})\sum_{j=1}^{l}w_{hj}g_{j}$

所以，我们得到整个BP神经网络的计算过程

输入：训练集D=（xk,yk），学习率 $\eta$ $\in$ (0,1)

过程：

1.在(0,1)范围内随机初始化网络中所有连接权和阈值

2.repeat

3. for all (xk,yk)

4. 根据当前参数和式（5.3）计算当前样本的输出 $\check{y_{k}}$

5. 根据式（5.10）计算输出层神经元的梯度项 $g_{i}$

6. 根据式（5.15）计算隐含层神经元的梯度项 $e_{i}$

7. 根据式（5.11）-（5.14）更新连接权 $w_{hj},w_{ih}$ 与阈值 $\theta _{j},\gamma _{j}$

8. end for

9. until 达到停止条件

输出：连接权与阈值确定的多层前馈神经网络

具体实例和代码，就等到下篇文章再记吧~

注：参考资料：《机器学习》周志华

猜你喜欢

转载自blog.csdn.net/Q755100802/article/details/82868508

神经网络学习——BP神经网络笔记

【学习笔记】BP神经网络学习

BP神经网络学习笔记

【学习笔记】BP神经网络

学习笔记（二）|| BP神经网络

BP神经网络笔记

BP神经网络学习

BP神经网络

BP 神经网络

神经网络——bp神经网络

神经网络学习(三)——BP神经网络算法

神经网络学习笔记1——BP神经网络原理到编程实现（matlab，python）

学习笔记：深度学习（2）——BP神经网络

机器学习之BP神经网络

BP神经网络学习算法原理

BP神经网络模型与学习算法

自己对bp神经网络学习的了解

机器学习：BP神经网络

机器学习算法--BP神经网络

深度学习之BP神经网络

BP神经网络算法学习

神经网络、BP算法、深度学习

深度学习｜BP神经网络

BP神经网络原理推导（学习笔记）

机器学习笔记(四)BP神经网络模型

详解BP神经网络

BP神经网络-总结

BP人工神经网络

图解bp神经网络

BP神经网络（一）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)