已知:
Zb×m[l]=Wb×a[l]⋅Aa×m[l−1]+v
b×1Ab×m[l]=g(Z[l])
g(.) 是 activation function,
dW 表示
dWdJ,其他的类似。
已知
dA[l],则:
dZb×m[l]=dA[l]∗g′(Z[l])dWb×a[l]=∂W[l]∂L=m1dZ[l]A[l−1]Tdbb×1[l]=∂b[l]∂L=m1i=1∑mdZ[l](i)(横向求和)dAa×m[l−1]=∂A[l−1]∂L=W[l]TdZ[l]