深度学习（计算机视觉）面试中问题（二）

博主在前面一篇博客，已经把面试问到的问题叙述了11个，接下来把最近遇到的问题拿出来分享，回答的的不对，麻烦指正，谢谢。前面一篇博客为：深度学习面试常问问题（一）

1、1*1卷积作用。

答：1. 实现跨通道的交互和信息整合

2. 进行卷积核通道数的降维和升维

3、实现多个feature map的线性组合，实现通道个数的变换。

4、对特征图进行一个比例缩放。

2、CNN池化层有什么作用？

答：1、减小图像尺寸，数据降维。

2、缓解过拟合。

3、保持一定程度的旋转和平移不变性，MaxPooling能保证卷积神经网络在一定范围内平移特征能得到同样的激励，具有平移不变形。

3、卷积神经网络中空洞卷积的作用是什么？

答、空洞卷积也叫扩张卷积，在保持参数个数不变的情况下增大了卷积核的感受野，同时它可以保证输出的特征映射（feature map）的大小保持不变。一个扩张率为2的3×3卷积核，感受野与5×5的卷积核相同，但参数数量仅为9个。

4、深度学习中常用的损失函数？

答：交叉熵损失，平方差损失，绝对值损失，Hinge Loss。具体介绍：损失函数具体介绍

5、 Sigmoid激活函数为什么会出现梯度消失？Sigmoid函数导数的最大值出现在哪个值？

答：为什么会出现梯度消失，从两方面来看，首先先看本身函数，若输入值X过大，sigmoid函数导数为零，第二方面：sigmoid函数求导，导数最大是等于1/4，小于1，经过深的网络传递就会出现梯度消失的问题。

在x=0时导数最大。

6.faster rcnn是怎么样一个框架？

答：有一篇博客讲的挺清楚的。rcnn系列详解

7、faster rcnn,roi pooling具体是如何工作的？（如何把不同大小的框，pooling到同样的大小）

答、RoIPool首先将浮点数值的RoI量化成离散颗粒的特征图，然后将量化的RoI分成几个空间的小块（spatial bins），最后对每个小块进行max pooling操作生成最后的结果。

8、评价指标有哪些？

答、机器学习中评价指标： Accuracy（准确率）、 Precision（查准率或者精准率）、Recall（查全率或者召回率）。

目标检测的指标：识别精度，识别速度，定位精度。

a、目标检测中衡量识别精度的指标是mAP（mean average precision）。多个类别物体检测中，每一个类别都可以根据recall和precision绘制一条曲线，AP就是该曲线下的面积，mAP是多个类别AP的平均值。

b、目标检测评价体系中衡量定位精度的指标是IoU,IoU就是算法预测的目标窗口和真实的目标窗口的交叠（两个窗口面积上的交集和并集比值）

9、深度学习训练时网络不收敛的原因有哪些？如何解决？

答：不收敛一般都是数据不干净，学习率设置不合理，网络等问题，详细知识根据博主的经验和看的的别人一些经验整理了下，

不收敛的原因与解决办法

10、如何应对图像光照变化大？

答：1、直方图均衡化

2、对比度拉伸，或者调节

3、若受光源影响，使得图片整体色彩往一方面移动，用白平衡算法进行修正，使其发黄、发蓝、发红的照片更加趋于自然光下的图像

4、若是过爆或者过暗，可是设计阈值函数，不用全局阈值，对特定区域进行特定阈值分割。

5、若是太暗，可以采用对数变化，对数图像增强是图像增强的一种常见方法，其公式为： S = c log(r+1)，对数使亮度比较低的像素转换成亮度比较高的，而亮度较高的像素则几乎没有变化，这样就使图片整体变亮。

6、采用拉普拉斯算子增强， filter2D(src,dst)

11、常用的分割方法有哪些？

答：1、基于阈值的分割方法：比较常用的阂值法有大律法、最小误差法

2、基于边缘的分割方法：常见的微分算子包括Robert算子、Prewitt算子、Sobel算子、Laplaeian算子、Canny算子等

3、基于区域的分割方法：主要包括种子区域生长法、区域分裂合并法和分水岭法等几种类型。

4、基于图论的分割方法：Graph Cut方法

5、深度学习：语义分割等