对CNN网络全连接层的一些理解 - 代码天地

对CNN网络全连接层的一些理解

其他 2018-12-09 14:43:19 阅读次数: 0

版权声明：站在巨人的肩膀上学习。 https://blog.csdn.net/zgcr654321/article/details/84894860

CNN网络的全连接层一般包含两个部分：

线性运算部分：完成线性变换的工作，将输入经过线性变换转换成输出。

非线性运算部分（以下简称非线性部分）：紧接着线性部分，完成非线性变换。

线性运算部分的作用：

线性部分从运算过程上看就是线性变换，对于一个输入向量，线性部分的输出向量是，线性部分的参数是一个mXn的矩阵W ，有时再加上一个偏置项，即：

这个运算到底做了什么工作呢？

表面上看就只是矩阵和向量相乘，再加上一个偏置向量。但如果我们输入的数据有一些含义时，这个操作就有了不同的意义。假设我们输入的数据是mnist的图片数据（一个28X28=784维的向量），这个784维的向量是784个像素点的数值，显然不同的数字0-9，它们各自的784个像素点的数值肯定是不一样的，而且这其中一定暗含着某种规律。我们使用上面的线性变换后可以得到一个向量，而不同的数字图片经过这个变换得到的向量显然有很大的区别。我们就称这个向量为原始图片数据经过神经网络提取出的“特征”。

非线性部分的工作：

非线性部分有很多种函数可以选择，这里就以sigmoid函数为例。

sigmoid函数形式：

函数图像如下：

非线性部分在模型中有很多作用，其中一个作用就是对数据的归一化。

比如Sigmoid 函数会将数据限制在(0,1)的范围中。这样后面的网络层如果要基于前面网络层的数据继续计算，网络内部的数值的范围就相对可控了。

如果不进行归一化，在下一层网络中，输入的数值大小可能不尽相同，有些比较大，有些比较小，那么在计算中那些大数字的重要性就会被强调，而小数字的重要性就会被忽略。这可能会导致到下几层网络后出现数值爆炸溢出的情况，最终导致网络输出的结果超过数字能表示的范围。

从反向计算网络时，如果每一层的数值大小都不一样，有的范围在(0,1)，有的在(0, 10000)，那么在做模型优化时，设定反向求导的学习率时就会出现很大的问题：如果设置过大，那么梯度较大的维度就会因为过量更新而造成无法预期的结果；如果设置过小，那么梯度较小的维度得不到充分的更新就难以有提升。

非线性部分还有一个重要的作用，就是打破线性映射关系。

如果全连接层没有非线性部分，只有线性部分，那么在模型中叠加多层神经网络是没有意义的，因为多层神经网络可以直接退化成一层神经网络。

举例：

假设有一个两层全连接神经网络，其中没有非线性层，那么对于第一层有：

对于第二层有：

我们合并上面两式：

这时可以发现，只要令，，就可以用一层神经网络来表示两层神经网络。所以说，没有非线性部分的深层神经网络是没有意义的，其效果和单层神经网络一样。

猜你喜欢

转载自blog.csdn.net/zgcr654321/article/details/84894860

对CNN网络全连接层的一些理解

对CNN网络卷积层的一些理解

cnn的一些理解

cnn全连接层

Caffe下卷积神经网络（CNN）中的一些特殊层(Batch Normalization)

关于卷积神经网络CNN全连接层

卷积神经网络CNN-全连接层

对全连接层的理解

卷积神经网络中关于全局平均池化代替全连接层、以及参数计算等的一些思考

直观理解神经网络最后一层全连接+Softmax

TensorFlow实现基础CNN,两层卷积+2层全连接网络demo

CNN的一些基础知识理解

对CNN感受野一些理解（转载）

对于卷积神经网络中全连接层的理解

CNN学习笔记：全连接层

卷积神经网络(CNN)中全连接层(FC layer)的作用

AI：卷积神经网络CNN中全连接层产生和意义

CNN全连接层和卷积层的转化

CNN04：池化层、全连接层

一些网络应用层协议

CNN入门讲解-为什么要有最后一层全连接？

一起学习用Verilog在FPGA上实现CNN----(七)全连接层设计

CNN全连接层怎么转化成一维向量？

一些理解

【深度学习基础】全连接层的理解

对全连接层的深入理解

池化层全连接层理解

【图像处理】CNN 入门讲解：什么是全连接层

花书+吴恩达深度学习（十二）卷积神经网络 CNN 之全连接层

数据访问层：DAO和Service层的一些理解

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)