1.目标检测概述

一、目标检测常用算法(基本流程,网络设计,训练技巧)

  • SSD系列算法(基本流程,Default boxPrior box,样本构造,数据增强,损失函数,SSD变种,网络性能对比,实验结果分析,不同算法优缺点,应用场景等)

  • YOLO系列算法(基本流程,主干网络结构,设计思路,Yolo v1/v2/9000/v3Anchor BoxesMulti-Scale TrainingDarknet,不同算法优缺点,网络性能对比,实验结果分析)

  • Faster RCNN系列算法(基本流程,RCNN / Faster RCNN,Faster RCNN变种,主干网络设计思想,RPN原理,OHEMNMSSoftNMS,实验结果分析,不同算法优缺点,应用场景)

  • 文本检测系列算法(传统文本检测方法,物体检测vs文本检测,文本检测算法优化方法,常用算法模型,CTPN/EAST/testboxes,文本检测数据集介绍,不同数据集比较)

  • 多任务系列算法(与案例分析,网络结构,泛化性分析,学习机制,使用场景,脸部特征点检测:TCDCN;人脸识别:DeepID2,物体检测与分类,旋转人脸网络,文本检测与识别,多任务网络训练技巧)

  • 应用案例:SSD人脸检测,YOLO V3通用物体检测,Faster RCNN ADAS场景,EAST自然场景文本检测

二、目标检测算法常见的开发流程

项目预研—算法选型—数据集下载和打包—环境搭建—模型训练—模型测试—模型优化

三、目标检测问题定义

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-e1EnHSH2-1577238287443)(C:\Users\mi\AppData\Roaming\Typora\typora-user-images\image-20191225082412264.png)]

三个难点:

1.目标种类与数量问题: 在进行目标检测的时候,一幅图像我们可能需要检测多个不同种类的物体。

2.目标尺度问题: 采集图像的时候,在同一张图片下,有的目标非常大,有的目标非常小,目标尺度变化越大,目标检测任务的难度就越大。这个时候,当目标尺度(也就是物体大小)非常小的时候,如果又特别稠密(数量多),则检测的难度就非常大了。

3.外界环境干扰问题: 光照,遮挡:图片质量,目标动态变化。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xnJB55jZ-1577238287445)(C:\Users\mi\AppData\Roaming\Typora\typora-user-images\image-20191225082354493.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8OYeG7Iq-1577238287447)(C:\Users\mi\AppData\Roaming\Typora\typora-user-images\image-20191225082230336.png)]

目标检测主要去定位物体的位置,位置信息通常表示为一个矩形,我们可以通过四维的数据进行表示;

目标分割可以通过不同的像素点进行不同类别的划分,这个时候我们的结果就需要同原始的图片大小保持一致;

因此目标分割往往会采用上采样或者是反卷积这样的方式来得到同原始图像大小的输出结构。

四、目标检测问题方法

在这里插入图片描述
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WeuNb7Cs-1577238287449)(C:\Users\mi\AppData\Roaming\Typora\typora-user-images\image-20191225093814916.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6wO98WdA-1577238287450)(C:\Users\mi\AppData\Roaming\Typora\typora-user-images\image-20191225094045919.png)]

Viola-Jones:(人脸检测等)

HOG+SVM:(行人检测等)

DPM:(基于HOG特征的一种变种,不过在DPM中会额外加入非常多的策略来提升检测精度,是非深度学习目标检测算法中性能最优的一种方法,可以称为传统目标检测方法的巅峰之作,但与深度学习方法相比还是存在较大差距)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UW8Qrd4l-1577238287452)(C:\Users\mi\AppData\Roaming\Typora\typora-user-images\image-20191225094018776.png)]

one-stageYOLOSSD系列):主要通过直接回归目标的位置来实现目标检测和定位。

two-stageFaster RCNN系列):通过利用RPN网络来对候选区域进行推荐。

在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7ObFHVNs-1577238287460)(C:\Users\mi\AppData\Roaming\Typora\typora-user-images\image-20191225094205771.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WynxYJ5H-1577238287462)(C:\Users\mi\AppData\Roaming\Typora\typora-user-images\image-20191225094223378.png)]

参考

https://blog.csdn.net/WYH19951220/article/details/88885024

发布了113 篇原创文章 · 获赞 57 · 访问量 4万+

猜你喜欢

转载自blog.csdn.net/weixin_43593330/article/details/103693586
今日推荐