小白带你反向传播算法训练神经网络和CNN

其他 2020-05-21 10:38:41 阅读次数: 0

小白带你反向传播算法训练神经网络

1.反向传播方法中，采用梯度下降的技术来训练神经网络

W(t+1)=W(t)-η∇C(W(t))

η是学习率可以固定为0.01 或者0.001
W(t+1)和W(t)分别是第（t+1）和第（t）次迭代时的权值向量。
∇C(W(t))是损失函数（cost function）或残差函数（error function）针对权值矩阵W在第（t）次迭代时的梯度。权重或者偏置w∈W的算法可以如下表示：

梯度下降学习方法的核心依赖针对每个权重值对损失函数的梯度计算。

如果y=f(x),z=f(y) 那么 z=f(f(x)) ，下面公式也可以成立。

如果输出值是连续的，那么损失函数C可以定义为预测差的平方：

最终的反向传播网络图

公式最终推导出

预测的误差（y-y’）与对应的激活函数和权值组合，以计算每个层权值梯度，被反向传播。也就是反向传播网络的由来。

2.CNN

CNN（Convolutional Neural Network) 是图像和音频数据处理。

CNN架构图

通过【图】CNN架构图，图片兔子，进过多次卷积-激活-池化操作，将图片的空间分辨率减低，然而每一层的输出特征图的个数一直在增加。卷积层的每个输出特征图都有一个对应的滤波核函数（filter kernel) 它的权重是通过CNN的训练过程学习得到的。

例如：

一个2×2的区域可以获得4个邻域特征图信息。对于最大池化（max-pooling）操作，4个特征数值中的最大值被选为输出。对于均值池化（average pooling），以4个特征数值中的平均值作为输出。池化减少了特征的空间维度。

例如：

对一个480×480大小的特征进行2×2区域的池化操作，那么输出的特征维度被减少至240×240。

如果用传统的全连接神经网络，那么它的权重值会是480X480X480X480，我们如果用2*2的滤波函数，那么权重就是4个，如果用3*3的滤波函数，那么权重就是9个，这样在处理图像和音频的时候大大简化操作。

猜你喜欢

转载自blog.csdn.net/keny88888/article/details/105745867

小白带你反向传播算法训练神经网络和CNN

(易懂)CNN卷积神经网络原理、过程 -小白带你弄清楚

小白带你学习卷积神经网络

小白带你神经网络向量化

卷积神经网络(CNN)反向传播算法

卷积神经网络CNN的反向传播算法推导

小白带你学习移动网络深度神经网络

CNN卷积神经网络和反向传播

小白带你去开启PyTorch神经网络工具箱

对于CNN卷积神经网络的前向传播和反向传播的理解

多层神经网络与反向传播算法

卷积神经网络的反向传播算法

神经网络参数的反向传播算法

神经网络反向传播算法

卷积神经网络反向传播算法

神经网络反向传播BP算法

神经网络——反向传播算法

Educoed--实现神经网络模型的前向传播、反向传播和训练

神经网络学习（十八）循环神经网络（RNN）的正向和反向传播算法梳理

卷积神经网络CNN的反向传播原理

CNN笔记（CS231N）——反向传播和神经网络（Backpropagation and Neural Networks）

深度学习：神经网络中的前向传播和反向传播算法推导

深度学习神经网络中的前向传播和反向传播算法推导

神经网络中的前向传播和反向传播的算法推导

神经网络训练中的Tricks之高效BP（反向传播算法）

神经网络的前向传播和反向传播推导

基于反向传播的多层神经网络训练原理(翻译)

利用反向传播训练多层神经网络的原理

使用反向传播训练多层神经网络的原理

神经网络-反向传播

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)