机器智能-高频问题:目标检测算法

6、计算机中的图像语义感知
a、Image Segmentation:将语义对象的位置进行分块,根据语义来进行图像位置的划分。
b、Image Classification:根据图像的特征来进行图像类别的判断
c、Object Detection:综合以上两者,目标检测,既要找到图像的位置,又要判断图像的语义。
d、Image Captioning:将所得到的信息用自然语言进行组织
7、目标检测:找出图像或者视频中所有感兴趣的目标(物体), 确定它们的类别和位置。问题包括:计算机中的图像是如何表示的?目标检测的模型是如何实现的?
8、图像的几何变换包括了图像的形状变换和图像的位置变换。图像的形状变换是指图像的放大、缩小与错切。图像的位置变换是指图像的平移、镜像与旋转。图像的几何变换通常在目标识别中使用。
9、图像错切:图像的错切变换实际上是平面景物在投影平面上的非垂直投影效果。
10、图像的旋转计算公式如下:
在这里插入图片描述
11、目标检测算法:问题牵引。
a、问题一:怎样训练一个好的模型?
b、问题二:怎样输出对象的类别和位置
12、目标检测算法:训练与测试
a、面对一张图片,随机选定一些框,如果这个框中包含了某些目标,则将框设置为正样本,否则设置为负样本。
b、将正样本和负样本丢给CNN卷积神经网络,进行训练。
c、框怎么画,是一个很大的问题
13、目标检测算法:数据预处理
a、训练钱的数据处理
①、从文件中读取图像和标注数据
②、图像增广,增加图像的数量,防止过拟合
③、批量读取:每次读取一个batch(批)的数据进行参数的更新
④、多线程加速
b、数据增广
①、随机改变亮度,对比度和颜色
②、随机填充
③、随机裁剪
④、随机缩放
⑤、随机翻转
14、目标检测算法:传统方法
a、先进行区域选择(随机选取一些框),然后进行特征提取,然后进行分类器分类
b、主要问题:
①、基于滑窗的区域选择策略没有针对性,时间复杂度高,窗口冗余;
②、手工设计的特征对于环境多样性的变化并没有很好的鲁棒性。
15、目标检测算法:二阶段方法
a、主要特点:
①、二阶段:
第一阶段:生成大量的候选区域(region proposals);
第二阶段:对每个region proposal提取特征并分类。
②、采用CNN来提取图片的特征。
b、慢:需要生成大量的region proposals;慢:需要对每个region proposal用CNN提取特征;不准:分类与特征提取分开,错误梯度无法传递
c、典型是:空间金字塔模型,大幅度提高了特征提取的速度。
16、目标检测算法:一阶段方法
a、二阶段方法先产生候选区域,再对区域进行分类和位置调整。
b、一阶段方法同时产生候选区域和分类结果。主要方法有YOLO, SSD, DSSD等。
c、YOLO :
将检测变为一个回归问题,YOLO 从输入的图像,仅仅经过一个神经网络,直接得到bounding boxes以及每个bounding box所属类别的概率。
端对端的优化网络结构。
标准版YOLO 每秒可以实时地处理 45 帧图像。

猜你喜欢

转载自blog.csdn.net/qq_40851744/article/details/106604939