《Randomized Low-Rank Dynamic Mode Decomposition for Motion Detection》读书笔记（下）

谢绝任何不标注出处的转载

如有问题请联系作者

原文链接：https://arxiv.org/abs/1512.03526

上文说了dmd的大概构建过程，这里复习DMD在背景提取上的应用。RPCA中对于背景提取已经有了成果，对于一个视频矩阵A，我们可以将其拆分成L和S两个矩阵。其中L是一个低秩矩阵，用于描述视频的背景；S是一个稀疏矩阵，用于描述视频中的动态物体：

DMD不能像RPCA这样直接将矩阵拆分，但是它可以求得一个矩阵的近似值。要做到背景提取，首先需要了解什么是傅里叶模式（Fourier modes）：

根据刘建忠：“傅里叶模式认为，人脑尝试记忆存储的是图像形状的傅里叶转换模式，而不是图像形状的原型。傅里叶变换的实质是将视网膜的到的图像的密度矩阵分解成一定频率上的信号，即把现实世界的图像通过一个变换而转变到频率空间上去，从而可以在频率空间看到原来在真实世界看不到的许多特征，并根据这些特征进行分析与识别。

傅里叶模式的优点有：

（1）当图像在一定范围内变化时，其傅里叶变换后的某些量仍未改变。图像平移不影响其傅里叶变换的幅度，即：只要知道一个图像的傅里叶变换的幅度，则无论该图像如何平移，都能根据原来的傅里叶变换幅度进行这一图像的识别。

（2）实现方便

傅里叶模式也有三个难以克服的缺点：

（1）傅里叶变换是对整个图像的变换，若图像由若干部分组成，则经傅里叶变换后的谱不能指出哪些谱是对应图像的哪一部分。

（2）图像的任何一小部分有一个无规则的变动，都会引起傅里叶谱的激烈变化（这是一个致命问题）。

（3）找不到一种将傅里叶谱与图像位置相对应的规律（感觉与（2）类似？）”【1】

用公式表示傅里叶模式有：

在标准视频中，我们默认delta t =1，所以wi就被简化成了第二个等号后面的式子。其中，得到的w的叙述部分表示模式的震荡（mode's oscillations）；实数部分是决定了单个模式随着时间的变化（determine the mode's evolution over time）。现在我们根据傅里叶模式重写DMD的公式：

如此一来，我们可以用w来替代复杂的λ奇异值的计算，是不是很方便呀~~然后我们可以将公式进步一改写为：

其中l是低秩矩阵L的element（background）； s是稀疏矩阵S的element（dynamics）。这个分解公式也是background和foreground的重构公式，拆开来用就好。或者可以用下式求得动态物体：

通常3-5 modes足矣。

大致的原理就结束啦，其实这么看来，rDMD和RPCA的思路还是非常像的，只不过DMD通过低秩让计算量减少，从而让算法速度增快啦~

参考资料：

【1】二次转载出处；https://blog.csdn.net/largestone_187/article/details/6158449

转载标注出处：http://hi.baidu.com/liujianz

《Randomized Low-Rank Dynamic Mode Decomposition for Motion Detection》读书笔记（下）

猜你喜欢