深度学习(计算机视觉)面试中问题(二)

博主在前面一篇博客,已经把面试问到的问题叙述了11个,接下来把最近遇到的问题拿出来分享,回答的的不对,麻烦指正,谢谢。前面一篇博客为:深度学习面试常问问题(一)

1、1*1卷积作用。

答:1. 实现跨通道的交互和信息整合

2. 进行卷积核通道数的降维和升维

3、实现多个feature map的线性组合,实现通道个数的变换。

4、对特征图进行一个比例缩放。

2、CNN池化层有什么作用?

答:1、减小图像尺寸,数据降维。

2、缓解过拟合。

3、保持一定程度的旋转和平移不变性,MaxPooling能保证卷积神经网络在一定范围内平移特征能得到同样的激励,具有平移不变形。 

3、卷积神经网络中空洞卷积的作用是什么?

答、空洞卷积也叫扩张卷积,在保持参数个数不变的情况下增大了卷积核的感受野,同时它可以保证输出的特征映射(feature map)的大小保持不变。一个扩张率为2的3×3卷积核,感受野与5×5的卷积核相同,但参数数量仅为9个。 

4、深度学习中常用的损失函数?

答:交叉熵损失,平方差损失,绝对值损失,Hinge Loss。具体介绍:损失函数具体介绍

5、 Sigmoid激活函数为什么会出现梯度消失?Sigmoid函数导数的最大值出现在哪个值?

答:为什么会出现梯度消失,从两方面来看,首先先看本身函数,若输入值X过大,sigmoid函数导数为零,第二方面:sigmoid函数求导,导数最大是等于1/4,小于1,经过深的网络传递就会出现梯度消失的问题。

在x=0时导数最大。

6.faster rcnn是怎么样一个框架?

答:有一篇博客讲的挺清楚的。rcnn系列详解

7、faster rcnn,roi pooling具体是如何工作的?(如何把不同大小的框,pooling到同样的大小)

答、RoIPool首先将浮点数值的RoI量化成离散颗粒的特征图,然后将量化的RoI分成几个空间的小块(spatial bins),最后对每个小块进行max pooling操作生成最后的结果。

8、评价指标有哪些?

答、机器学习中评价指标: Accuracy(准确率)、 Precision(查准率或者精准率)、Recall(查全率或者召回率)。

目标检测的指标:识别精度,识别速度,定位精度。

a、目标检测中衡量识别精度的指标是mAP(mean average precision)。多个类别物体检测中,每一个类别都可以根据recall和precision绘制一条曲线,AP就是该曲线下的面积,mAP是多个类别AP的平均值。

b、  目标检测评价体系中衡量定位精度的指标是IoU,IoU就是算法预测的目标窗口和真实的目标窗口的交叠(两个窗口面积上的交集和并集比值)

9、深度学习训练时网络不收敛的原因有哪些?如何解决?

答:不收敛一般都是数据不干净,学习率设置不合理,网络等问题,详细知识根据博主的经验和看的的别人一些经验整理了下,

不收敛的原因与解决办法

10、如何应对图像光照变化大?

答:1、直方图均衡化

2、对比度拉伸,或者调节

3、若受光源影响,使得图片整体色彩往一方面移动,用白平衡算法进行修正,使其发黄、发蓝、发红的照片更加趋于自然光下的图像

4、若是过爆或者过暗,可是设计阈值函数,不用全局阈值,对特定区域进行特定阈值分割。

5、若是太暗,可以采用对数变化,对数图像增强是图像增强的一种常见方法,其公式为: S = c log(r+1),对数使亮度比较低的像素转换成亮度比较高的,而亮度较高的像素则几乎没有变化,这样就使图片整体变亮。

6、采用拉普拉斯算子增强 , filter2D(src,dst)

11、常用的分割方法有哪些?

答:1、基于阈值的分割方法:比较常用的阂值法有大律法、最小误差法

2、基于边缘的分割方法:常见的微分算子包括Robert算子、Prewitt算子、Sobel算子、Laplaeian算子、Canny算子等

3、基于区域的分割方法:主要包括种子区域生长法、区域分裂合并法和分水岭法等几种类型。

4、基于图论的分割方法:Graph Cut方法

5、深度学习:语义分割等

猜你喜欢

转载自blog.csdn.net/comway_Li/article/details/82947716