二.线性神经网络 - 代码天地

二.线性神经网络

其他 2018-11-12 21:21:14 阅读次数: 0

　　自适应线性元件20世纪50年代末由Widrow和Hoff提出，主要用于线性逼近一个函数式而进行模式联想以及信号滤波、预测、模型识别和控制等。

　　线性神经网络和感知器的区别是，感知器只能输出两种可能的值，而线性神经网络的输出可以取任意值。线性神经网络采用Widrow-Hoff学习规则，即LMS（Least Mean Square）算法来调整网络的权值和偏置。线性神经网络在结构上与感知器非常相似，只是神经元激活函数不同。在模型训练时把原来的sign函数改成了pureline函数(y=x)

　　只能解决线性可分的问题。

　　与感知器类似，神经元传输函数不同。

线性神经网络结构

两个激活函数，当训练时用线性purelin函数，训练完成后，输出时用到sign函数　(>0, <0)

假设输入是一个N维向量（公式1）,从输入到神经元的权值为wi，则输出为公式2.

若传递函数采用线性函数purelin，则输入与输出为一个简单的比例关系，x(n),w(n),y,q写成矩阵的形式，公式如下、

若网络中包含多个神经元节点，则可以形成多个输出，这种可以以两种间接的方式解决线性不可分问题

用多个线性函数对区域进行划分，然后对各个神经元的输出做逻辑运算
或者对神经元添加非线性输入，引入非线性成分。

LMS 最小均方规则

LMS 学习规则可以看作是δ学习规则的一个特殊情况

LMS算法只能训练单层网络，，但是单层网络理论上讲不会比单层网络差。
该学习规则与神经元采用的转移函数无关，因而不需要对转移函数求导，不仅学习速度较快，而且具有较高的精度，权值可以初始化为任意值，通过权值调整使得神经元实际输出与期望输出之间的平方差最小:

定义某次迭代时的信号为　　e(n)=d(n)-x^T(n)w(n)

n为迭代次数，d表示期望输出，采用均方误差作为评价指标。

Q是输入训练样本的个数。线性神经网络学习的目标是找到适当的w，使得均方差mse最小。mse对w求偏导，令偏导等于0求得mse极值，因为mse 必为正，二次函数凹向上，求得的极值必为极小值。

　　　实际运算中，为了解决权值w维数过高，给计算带来困难，往往调节权值，使mse从空间中的某一点开始，沿着斜面向下滑行，最终达到最小值。滑行的方向使该店最陡下降的方向，即负梯度方向。

　　　实际计算中，代价函数常定义为

　　　　　　　　　　　　　　　　　　　

Delta学习规则

1986年，认知心理学家McClelland和Rumelhart 在神经网络训练中引入该规则，也成为连续感知器学习规则
该学习规则是一种利用梯度下降法的一般性的学习规则

代价函数(损失函数) (Cost Function, Lost Function)

误差E是权向量Wj的函数，欲使误差E最小，Wj应与误差的负梯度成正比

梯度即是导数，对误差（代价／损失）函数求导，

该学习规则可以推广到多层前馈网络中，权值可以初始化为任意值。

梯度下降法的问题

学习率难以选取，太大会产生振荡，太小收敛缓慢
容易陷入局部最优解
第一个问题解决方法，开始的学习率可以设的较大，后面逐渐调小学习率

LMS算法步骤

(1)定义变量和参数。

　　x(n)=N+1维输入向量=[+1,x1(n),x2(n),...,xN(n)]T

　　w(n)=N+1维权值向量=[b(n),w1(n),w2(n),...,wN(n)]T

　　b(n)=偏置

　　y(n)=实际输出

　　d(n)=期望输出

　　η(n)=学习率参数，是一个比1小的正常数

(2)初始化。n=0,将权值向量w设置为随机值或全零值,n=0。

(3)输入样本，计算实际输出和误差，根据给定的期望输出d(n)，计算得:e(n)=d(n)-xT(n)*w(n)

(4)更加所算的的结果调整权值向量（由上图所给公式）

(5)判断算法是否收敛，若满足收敛条件，则算法结束，否则继续

收敛条件：当权值向量w已经能正确实现分类时，算法就收敛了，此时网络误差为零。收敛条件通常可以是：

　　　　误差小于某个预先设定的较小的值ε。即

　　　　　　　　　　　　　　　　　　|e(n)|<ε

　　　　两次迭代之间的权值变化已经很小，即

　　　　　　　　　　　　　　　　　　|w(n+1)-w(n)|<ε

　　　　设定最大迭代次数M，当迭代了M次就停止迭代。

LMS算法中学习率的选择

LMS算法中，学习率的选择十分重要，直接影响了神经网络的性能和收敛性。

　1996年Hayjin证明，只要学习率η满足 LMS算法就是按方差收敛的。

　　　　　　其中，λmax是输入向量x（n）组成的自相关矩阵R的最大特征值。往往使用R的迹（trace）来代替。矩阵的迹是矩阵主对角线元素之和。

　　　　　　可改写成 0<η<2/向量均方值之和。

　　学习率逐渐下降：

　　　　学习初期，用比较大的学习率保证收敛速度，随着迭代次数增加，减小学习率保证精度，确保收敛。

学习率逐渐下降如何设计：多种方式，自己可以思考思考

线性神经网络与感知器的对比

LMS算法运用梯度下降法用于训练线性神经网络，这个思想后来发展成为反向传播算法用于训练多层神经网络。

两者的传输函数不一样导致感知器只能用于分类，而线性神经网络还可以用于拟合或者逼近

LMS算法的分类边界往往处于两种模式的中间，容错能力强，感知器算法则在刚好能正确分类的地方就停下了，容错能力差。

猜你喜欢

转载自www.cnblogs.com/pythonlearing/p/9949002.html

二.线性神经网络

二、线性神经网络

线性神经网络

神经网络学习(二)——自适应线性神经网络

神经网络线性单元

MATLAB——线性神经网络

3 线性神经网络

线性神经网络-线性回归

线性回归-线性神经网络

【从线性回归到BP神经网络】第二部分：线性回归

独家连载 | 线性神经网络应用

自适应线性神经网络Adaline

多层神经网络的线性与拟合问题

从线性回归到神经网络

卷积神经网络——非线性激活

神经网络-非线性激活

线性回归和神经网络的联系

什么是神经网络的非线性

3 线性神经网络-代码详解

卷积神经网络二

卷积神经网络（二）

神经网络的学习（二）

神经网络简介(二)

卷积神经网络（二）—— 所谓卷积神经网络

神经网络（二）卷积神经网络

神经网络的认识（二）深层神经网络

【神经网络】之神经网络基础（二）

神经网络基础学习笔记（二）神经网络

【神经网络】线性模型非线性模型，感知机与神经网络

神经网络通俗讲，麻瓜变大神(二)-解释非线性

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)