Moving Region Detection in Compressed Video运动检测论文翻译

摘要

本论文最大的特点是在变换域进行运动检测,而不是传统的空间域。首先通过预测的方式得到当前帧的系数(如小波系数),然后与本帧实际的系数进行对比,从差异中确定运动区域。如果是DCT变换,则使用8*8块的直流系数来估计背景场景。

介绍

基于视频的监督系统被广泛应用,尤其是在安防领域,一些数字摄像头有内置的数据压缩系统而且只提供压缩后的视频,这样就需要我们可以在对压缩后的视频进行处理。在本文中,首先假设视频是用DCT或者WT压缩的。
检测运动区域的核心内容分为两部分:1.估计背景区域系数值,2.对比当前系数值和背景区域系数值。而一个简单的确定背景区域系数值的办法是使用平均值来作为其系数值,因为变化的区域只是在时间上持续一小段时间,因此平均操作可以消除之前这些运动的影响。
论文中提到了一些用于在空间中检测运动的方法,也可以借鉴参考。

运动物体检测混合算法

首先必须是一段时间的观测结果,时间短会导致背景检测的结果不准确。根据介绍里面提到的两个步骤,实际上主要工作就是获取两个值,对每个像素来说,一个是当前帧的像素值,另外一个是估计的背景像素值,其中当前帧的像素值很好获取,难点在于获取每个像素点的额背景像素值,在本文中叙述了一种自适应更新的方法。

I_n(x,y),B_n(x,y),T_n(x,y)

其中I是当前帧的值,B是估计的背景值,T是阈值,B和T都是自适应更新的,首先根据B和T判断当前像素是否是变化像素,再对该像素值的B和T进行更新。

初始值设定:

B_0(x,y)=I_0(x,y)

运动像素检测:

|I_n(x,y)-I_{n-1}(x,y)|>T_n(x,y)

如果(x,y)不是运动像素

B_{n+1}(x,y)=aB_n(x,y)+(1-a)I_n(x,y)

T_{n+1}(x,y)=aT_n(x,y)+(1-a)(c|I_n(x,y)-B_n(x,y)|)

如果(x,y)是运动像素

B_{n+1}(x,y)=B_n(x,y)

T_{n+1}(x,y)=T_n(x,y)

运动物体检测,所有满足以下条件的像素归入运动物体:

|I_n(x,y)-B_n(x,y)|>T_n(x,y)

猜你喜欢

转载自blog.csdn.net/gaussrieman123/article/details/78193862