一、RCNN
1. R-CNN
- RCNN 算法结构是两级网络,首先需要诸如 选择性搜索 之类的算法来提出可能包含对象的候选边界框;然后将这些区域传递到 CNN 算法进行分类;
- 存在的问题:
仿真速度很慢,并且不是完整的端到端的目标检测器。
FPS: 1秒内识别的图像数(帧数)
2. fast R-CNN
- 对原始 R-CNN 进行改进,即提高准确率并减少正向传递所花费的时间,但是该模型仍然是依赖于 外部区域搜索 算法。
3. faster R-CNN
- 删除了选择性搜索的要求,成为了真正的端到端深度学习目标检测器。
- 依赖于 完全卷积的区域提议网络(RPN) 和 可以预测对象边界框和“对象”分数 (量化它是一个区域的可能性的分数),然后将 RPN 的输出传递到 R-CNN 组件以进行最终分类和标记。