《计算机视觉》集大网课笔记【7】

企业开发 2023-06-24 21:35:58 阅读次数: 0

目标检测算法

问题及简史

滑动窗口法：不断在图像中切出小的图像块，检测完所有图像块后再进行置信度判断，留下的方框作为检测结果。①对图像尺寸进行缩放。②图像窗口尺寸变化。

AdaBoost：加大错分样本的权重，以使下一次分类正确。不断构造弱分类器，实现多个弱分类器的结连，从而形成强分类器

基于深度学习的检测算法

R-CNN基本策略

输入测试图像；
利用selective search算法在图像中从上到下提取2000个左右的候选区域；
将每个候选区域缩放成227*227的大小并输入到CNN，将CNN的fc7层的输出作为特征；
将每个候选区域提取的CNN特征输入到SVM进行分类；
对于SVM分好类的候选区域做边框回归

R-CNN的缺点：

训练分为多个阶段，步骤繁琐：微调网络+训练SVM+训练边框回归器；
训练耗时，占用磁盘空间大；5000张图像产生几百G的特征文件；
速度慢：使用GPU，VGG16模型处理一张图像需要47s；
测试速度慢：每个候选区域需要运行整个前向CNN计算；
SVM和回归是事后操作，在SVM和回归过程中CNN特征没有被学习更新。

Fast R-CNN基本策略

输入测试图像；
利用selective search算法在图像中从上到下提取2000个左右的候选窗口；
将整张图片输入CNN，进行特征提取；
把候选窗口映射到CNN的最后一层卷积特征图上；
通过RoI pooling层使每个候选窗口生成固定尺寸的特征图/向量；
利用Softmax Loss和Smooth L1 Loss（探测边框回归）对分类概率和边框回归进行联合训练。

与R-CNN相比：

最后一层卷积层后加了一个ROI pooling layer；
损失函数使用了多任务损失函数（multi-task-loss），将边框回归直接加入到CNN网络中训练

改进之处：

速度的提升： R-CNN的候选框之间大量重叠，造成了运算能力的浪费。FAST-RCNN将整张图像归一化后直接送入CNN，在最后的卷积层输出的feature map上，加入建议框信息，使得在此之前的CNN运算得以共享。

Faster R-CNN

输入测试图像；
将整张图片输入CNN，进行特征提取；
用RPN生成候选窗口，每张图片保留约300个Proposal；
把候选窗口映射到CNN的最后一层卷积特征图上；
通过RoI pooling层使每个RoI生成固定尺寸的特征图；
利用Softmax Loss和Smooth L1 Loss（探测边框回归）对分类概率和边框回归的联合训练。

Region Proposal Network（RPN）

在feature map上滑动窗口，在每个位置上产生若干个候选anchor（N=9）
建一个神经网络用于anchor分类+框位置的回归
滑动窗口的位置提供了物体的大体位置信息
框的回归提供了框更精确的位置

猜你喜欢

转载自blog.csdn.net/fjyalzl/article/details/127194151

《计算机视觉》集大网课笔记【7】

《计算机视觉》集大网课学习笔记【6】

《计算机视觉》集大网课学习笔记【5】

《计算机视觉》集大网课学习笔记【4】

《计算机视觉》集大网课笔记【3】

《计算机视觉》集大网课笔记【2】

《计算机视觉》集大网课学习笔记【1】

《计算机视觉中的多视图几何》笔记（7）

计算机视觉数据集介绍

计算机视觉·常用数据集

计算机视觉数据集

【计算机视觉】步态数据集

计算机视觉数据集

UCAS-AI学院-计算机视觉专项课-第4讲-课程笔记

UCAS-AI学院-计算机视觉专项课-第3讲-课程笔记

UCAS-AI学院-计算机视觉专项课-第2讲-课程笔记

UCAS-AI学院-计算机视觉专项课-第1讲-课程笔记

计算机视觉自学笔记

计算机视觉笔记及资料整理

计算机视觉入门笔记

计算机视觉入门live笔记

计算机视觉面经笔记

计算机视觉公式笔记

Keras笔记--计算机视觉

AI笔记: 计算机视觉概述

（学习笔记）计算机视觉（下）

（学习笔记）计算机视觉（上）

计算机视觉CV笔记

深度学习笔记-计算机视觉

计算机视觉学习笔记

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)