计算机视觉面试考点(9)全连接层

计算机视觉工程师在面试过程中主要考察三个内容:图像处理、机器学习、深度学习。然而,各类资料纷繁复杂,或是简单的知识点罗列,或是有着详细数学推导令人望而生畏的大部头。为了督促自己学习,也为了方便后人,决心将常考必会的知识点以通俗易懂的方式设立专栏进行讲解,努力做到长期更新。此专栏不求甚解,只追求应付一般面试。希望该专栏羽翼渐丰之日,可以为大家免去寻找资料的劳累。每篇介绍一个知识点,没有先后顺序。想了解什么知识点可以私信或者评论,如果重要而且恰巧我也能学会,会尽快更新。最后,每一个知识点我会参考很多资料。考虑到简洁性,就不引用了。如有冒犯之处,联系我进行删除或者补加引用。在此先提前致歉了!

全连接层大家都比较了解
这篇博客以问答形式作为查缺补漏和进一步理解

全连接层的位置?
神经网络的最后几层
全连接层的输出会使用激活函数进行激活
通常会有多个全连接层相连

全连接层的作用?
转换特征维度
如2048个神经元的全连接层与1000个神经元的全连接层相连
就将2048维的特征转换为了1000维的特征

在CNN中将特征图转换为向量

在CNN中将特征图位置关系打破
不受图像空间位置影响,对空间变化具有鲁棒性
不过这也导致无法进行图像分割

多个全连接层相连,实现了特征的组合
换句话说,下一个全连接层将上一个全连接层的输出(特征)进行组合
形成了更具有表征意义的特征
这也是进一步增强非线性、提升模型解决复杂问题能力的体现

实现分类
比如1000分类
全连接层将特征转换为1000x1的向量
1000x1的向量经过softmax就可以输出每一个类别的概率

全连接层的计算?
以下分析暂时不考虑激活函数
3维全连接层x–>2维全连接层y:
y1=w11*x1+w21*x2+w31*x3+b1
y2=w12*x1+w22*x2+w32*x3+b2

卷积层–>全连接层:
在这里插入图片描述

全连接层的参数?

宽度:每个全连接层的神经元个数
深度:全连接层的层数

两者变大
提升模型复杂度,增强非线性
训练成本增加,容易过拟合

两者变小
模型能力下降

全连接层参数量巨大
神经网络的大部分训练参数都是全连接层的
结合这个,想象一下4096维到1000维的全连接层的参数量:
3维全连接层x–>2维全连接层y:
y1=w11*x1+w21*x2+w31*x3+b1
y2=w12*x1+w22*x2+w32*x3+b2


欢迎讨论 欢迎吐槽

发布了47 篇原创文章 · 获赞 170 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/weixin_39417323/article/details/105664033
今日推荐