1.定义
wlkj
表示从l-1层的第k个感知器到第l层的第j个感知器的权重
blj
用来表示l层第j个感知器的偏置项,
alj
则表示l层第j个感知器的激活值(对加权后的输出值使用激活函数非线性处理,激活函数会作用于每一个感知器上也就是不仅仅是最后一个输出)
则有
alj=∑kwlkjal−1j+blj
向量化表示:
wl
为权重矩阵,
bl
为偏置矩阵,
al
为激活值矩阵,
zl
为加权输入矩阵则有:
zl=wlal−1+bl
al=σ(zl)=σ(wlal−1+bl)
值得注意的是
zl
由
zlj=∑kwljkal−1k+blj
组成,这就是说,
zlj
就是第 l层第 j个感知器激活函数的加权输入。
定义l层第j个感知器的错误量
δlj
为:
δlj=∂C∂zlj
定义中的错误量都是对加权输出的偏导并不是对激活值得偏导
2.基本公式
(1). 输出层错误量的等式:
δLj=∂C∂aLjσ′(zLj)
(2).依据下一层错误量
δl+1
获取错误量
δl
的等式:
δl=((wl+1)Tδl+1)⊙σ′(zl)
(3).网络的代价函数相对于偏置的改变速率的等式:
∂C∂blj=δlj
(4).网络的代价函数相对于权重的改变速率的等式:
∂C∂wljk=al−1kδlj
公式证明连接:1,2,3
本文用到的公式编辑方式:
公式编辑1,公式编辑2,公式编辑3