FasterRcnn中boundingbox regression的一些理解 - 代码天地

FasterRcnn中boundingbox regression的一些理解

其他 2018-09-27 04:07:57 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qian99/article/details/82218963

在fasterrcnn中，做框的回归，有三个输入，anchor，预测的框，groundtruth的框。一个框的表示，使用中心点 $(x, y)$ ，和框的宽高 $(w,h)$ 表示。

那么这个回归的loss怎么算呢？首先看下图：

其中：
绿框：ground truth box
红框：predict box
蓝框：anchor box

首先我们需要明白下面两个问题：
1. anchor box， ground truth box和predict box的宽高的大小之间没有大小关系，哪个框都有可能比其他框大或者小
2. 坐标值与宽高不能用绝对值，也就是用原始的坐标和宽高，这是由于做了roipooling，将每个anchorbox的feature变成了同样的size。

所以，做这个回归，要先对box的值做一些处理：

$x_a$ 表示anchor box的 $x$ , $x$ 表示predict box的 $x$ ， $x^*$ 表示ground truth box的 $x$ 。剩下的 $y , w, h$ 同理。

可以看出来，这里 $t_x， t_y$ 是计算了相对于anchor box中心点的相对距离，然后做了normalize。

但是 $t_w, t_h$ 呢？为什么要用一个 $log$ 呢，刚开始一直没想明白，后来发现，这其实是个很简单的事情，上面说了，实际上的 $w, h, w^*, h^*$ 可能大于或小于 $w^a, h^a$ ，但实际我们想要的值是一个范围是 $(0, 1]$ 的值，表示预测的结果是anchor box宽高的多少倍。比较容易想到的是使用指数函数来“包装”一下：

简单来说，假设回归结果为 $w_p, h_p$ ，那么实际的预测结果就应该为：

w = e x p (w_{p}) * w_{a}

$w = exp(w_p) * w_a$

h = e x p (h_{p}) * h_{a}

$h = exp(h_p) * h_a$

这下就清楚了，为了预测结果是exp的形式，在训练的时候，就要把输入做“反向”的处理，也就是 $t_w = log(w/w_a)$ 。

猜你喜欢

转载自blog.csdn.net/qian99/article/details/82218963

FasterRcnn中boundingbox regression的一些理解

在实现linear regression中遇到的一些问题

线程调用中的一些理解

一些php中session的理解

关于JavaScript中this的一些理解

Spring中事务的一些理解

Javascript中this的一些简单理解

fasterrcnn 理解

Git 学习过程中遇到的一些坑和自己的一些理解

JAVA中关于并发的一些理解

Java中的线程与锁的一些概念理解

对Unity中的多线程的一些理解

Hadoop中MapReduce的一些关键词理解

事务的理解与spring中的一些配置

javascript中sort()排序的一些理解

关于python中decode和encode的一些理解

OO思想中的一些总结与理解

关于Linux中umask的一些理解

对ThreadLocal在Handler中的应用的一些理解

【mysql】关于innodb中MVCC的一些理解

Java中关于泛型的通配符的一些理解

个人对JAVA中的继承和多态的一些理解

关于Faster-Rcnn中的AnchorBox的一些理解

Java基础中的一些概念理解

flink中对于window和watermark的一些理解

关于HTML5中WebSocket的一些理解

关于macroblaze的一些理解（更新中）

对java中int与Integer的一些理解

关于innodb中MVCC的一些理解

谈谈对try-catch中finally的一些理解

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)