It's Moving! A Probabilistic Model for Causal Motion Segmentation in Moving Camera Videos

项目地址:http://vis-www.cs.umass.edu/motionSegmentation/

方法

如果相机相对背景的运动只有平移(没有旋转),背景光流的有很强的约束,由相机平移\left ( U,V,W \right )、图像坐标\left ( x,y \right )和焦距f决定的像素运动方向t_{\theta}​​​和场景深度无关。

t_{\theta} = \arctan \left ( W\cdot y-V\cdot f,W\cdot x-U\cdot f\right )

对于平移旋转混合的情况,从原始光流O中减去估计的旋转成分\hat{O}_R,得到一个平移成分的估计\hat{O}_T

用于运动分割的概率模型

给定帧T-1的运动分割,共有k个运动目标,光流O_{T,T+1},分割帧T需要几个先验:

  • 对于每个特定的运动模型M_j,每个像素属于该模型的先验概率p\left ( M_j \right )
  • 对于前一帧的k个运动目标,他们在相邻帧之间的3D运动方向的估计M_j
  • 对于每一个像素位置,在每个以向量大小为t_r为条件的运动模型M_j的先验下,该像素位置的一个运动方向角的概率p\left ( t_{\theta}|M_j,t_r \right )
  • 一个新运动M_{k+1}的先验概率p\left ( M_{k+1} \right )和角可能性分布p\left ( t_{\theta}|M_{k+1},t_r \right )

有这些先验和概率,使用贝叶斯原理去得到每个像素位置中每个运动的后验概率:

p\left ( M_j|t_\theta,t_r \right )\propto p\left( t_\theta|M_j,t_r\right )\cdot p\left(M_j|t_r \right )=p\left( t_\theta|M_j,t_r\right )\cdot p\left(M_j \right )

第二个等号时因为M_j的概率和t_r无关(不理解)

Bruss and Horn's 运动估计

1983年的工作……没心思去看,大概的意思是估计相机相对背景的运动方向。

把Bruss and Horn 方法用于通过背景先验选择的像素:

光流\text{v}_i可以被分解为\text{v}_i=\text{p}_i+\text{e}_i\text{p}_i\text{v}_i在运动模型M_b推导的方向上的分量,\text{e}_i则是与\text{p}_i正交的分量,Bruss and Horn方法就是寻找一个运动模型M使得\text{e}_i的和最小,只有平移的优化如下:

\arg\min_{U,V,W}\sum _i \left \| \text{e}_i\left(\text{v}_i,U,V,W \right ) \right \|

对于只有平移的情况,Bruss and Horn方法给出了这优化问题的一个近似形式的解。

文章使用了自己的方法估计旋转和平移,使用的是一个嵌套的优化:

\hat{M}=\arg\min_{A,B,C,U,V,W}\left [\arg\min_{U,V,W}\sum _i \left \| \text{e}_i\left(\text{v}_i,A,B,C,U,V,W \right ) \right \| \right]

给定观测光流的O的旋转成分\hat{O}_R,由于旋转成分和场景几何无关,可以从观测光流中减去旋转成分:\hat{O}_T = O - \hat{O}_R

初始化:分割第一帧

初始化的目标有

  • 估计背景平移和旋转参数
  • 找到符合背景运动的像素点集合
  • 为额外的运动模型分配不一致的连续像素组,即剩下的像素点的分割

Bruss and Horn 方法并非用于处理有多个不同运动的场景,并且太大或者高速移动的前景目标会导致一个很差的运动估计。如下图所示

使用改进版本的RANSAC处理上述问题,鲁棒地估计背景运动。如下图所示

文章中使用了10个随机的SLIC超像素去估计相机运动。

通过修改RANSAC算法使得算法选择从图像角落选择3/10的超像素,因为由于对相机旋转的错误估计,图像角落倾向于错误结果。

猜你喜欢

转载自blog.csdn.net/qq_25379821/article/details/83051028