Bounding Box Regression

为什么要进行Bounding Box Regression?


    绿色的框表示Ground Truth, 红色的框为提取的Region Proposal。如果对红色的框进行微调,使得经过微调后的窗口跟Ground Truth 更接近, 这样定位会更准确。Bounding box regression 就是用来微调这个窗口的。

什么是Bounding Box Regression?

    一般使用四维向量(x,y,w,h) 表示窗口,分别表示窗口的中心点坐标、宽和高。红色的框 P 代表原始的Proposal,绿色的框 G 代表目标的 Ground Truth,我们的目标是寻找一种关系使得输入原始的窗口 P 经过映射得到一个跟真实窗口 G 更接近的回归窗口G^。即:给定(Px,Py,Pw,Ph)寻找一种映射f,使得f(Px,Py,Pw,Ph)=(Gx^,Gy^,Gw^,Gh^) 并且 (Gx^,Gy^,Gw^,Gh^)≈(Gx,Gy,Gw,Gh)

Bounding Box Regression是怎么做的?

经过何种变换才能窗口 P 变为窗口G^?比较简单的思路就是: 平移+尺度放缩

先做平移(Δx,Δy), Δx=Pwdx(P),Δy=Phdy(P) :

    G^x=Pwdx(P)+Px

    G^y=Phdy(P)+Py

再做尺度缩放(Sw,Sh), Sw=exp(dw(P)),Sh=exp(dh(P)):

    G^w=Pwexp(dw(P))

    G^h=Phexp(dh(P))

    Bounding Box Regression学习的就是dx(P),dy(P),dw(P),dh(P)这四个变换。下一步就是设计算法得到这四个映射。

    线性回归就是给定输入的特征向量 X, 学习一组参数 W, 使得X经过线性回归后的值跟真实值 Y(Ground Truth)非常接近. 即Y≈WX那么 Bounding-box 中我们的输入以及输出分别是什么呢?

猜你喜欢

转载自blog.csdn.net/weixin_38056657/article/details/80332910
今日推荐