目录
•写在前面
快速傅里叶变换是一种可在 时间内完成的离散傅里叶变换算法。在算法竞赛中的运用主要是用来加速多项式的乘法。我们这里做一个简单的引入,考虑到两个多项式 的乘积 ,假设 的项数为 ,其系数构成的 维向量为 , 的项数为 ,其系数构成的 维向量为 。我们要求 的系数构成的 维的向量,先考虑朴素做法,可以用这段代码表示:
for ( int i = 0 ; i < n ; ++ i )
for ( int j = 0 ; j < m ; ++ j )
c [i + j] += a [i] * b [j] ;
这里思路虽然非常清晰,但是它的时间复杂度是,显然不够高效,那么我们就来学快速傅里叶变换,提高效率。
•讲一讲多项式
多项式有两种表示方法,系数表达法与点值表达法。
多项式的系数表示法
设多项式 为一个 次的多项式,显然,所有项的系数组成的系数向量 唯一确定了这个多项式。数学形式为:
多项式的点值表示法
设多项式 为一个 次的多项式,将一组互不相同的 (叫插值节点)分别带入 ,得到 n 个取值 ,数学形式为:
可能对于点值表示法不太理解,这里我进一步解释一下,首先我们先的知道定理结论:一个 次多项式在 个不同点的取值唯一确定了该多项式。为什么有这个结论?证明如下:
理解了不?如果还不理解,好,那么我更加通俗的来讲,求多项式乘法像这样: 。可是如果单单就是这样相乘就没有什么可优化的了,让我们来这样想一下,多项式其实也是一个函数,每一个 值都对应一个 值,那么就如两个点确定一条直线一样,我们也能用几个点确定一个多项式,这就是点值表示法。 如果多项式的最高次项的次数为 ,那么在常数已知的情况下,我们只需要知道n个不同点就能联立求得多项式了,那么我就可以用这 个点的集合表示这个多项式了。只要把点值对应相乘就可以了,复杂度为 。 那么问题来了,如果单纯的代值进去,运算量会非常大,复杂度为 ,这时候就需要用到快速傅立叶变换了。
多项式的乘法
已知在一组插值节点 中 (假设个多项式的项数相同,没有的视为 )的点值向量分别为 ,那么 的点值表达式可以在 的时间内求出,为 。因为 的项数为 的项数之和。设 分别有 项。所以我们带入的插值节点有至少有 个。如果我们能快速通过点值表式求出系数表示,那么就搭起了它们之间的一座桥了。这也是快速傅里叶变换的基本思路,由系数表达式到点值表达式到结果的点值表达式再到结果的系数表达式。
可能到这里还是不够形象,那么引入卷积来解释,我这里引入卷积并不是百度什么的那么抽象,我用一个通俗的例子来解释:假如我打了你一拳,这一拳的痛感会在 个小时之内消失,但你这一个小时之内的感觉也不一样。我们记使用最轻的力打你一拳时,你在这一个小时内的疼痛感觉图像为 ,那么用两倍的力打你就是 ,三倍力 …… 倍力就为。如果我每秒打你一次,连续打你半分钟,那么你在一个小时零半分钟之内都会感到疼(每一次有新痛感来临时上一次痛感都会变化),那么怎么计算你在这一时间段内某一秒时的痛感呢?就是把之前的所有痛感叠加起来啊!,然而当你每次被打一拳的前无穷小时刻与后无穷小时刻都被打了一拳,那么我就认为打你是一件连续的行为,这时候就要把加和改写为积分了:,卷积就可以这么形象的理解。
而卷积定理指出:函数卷积的傅里叶变换是函数傅里叶变换后的乘积! 也就是说要求两个函数的卷积,我们就可以先把两个函数做傅立叶变换,之后算出它们的乘积,再做一次傅立叶逆变换就得出结果了!瞬间变得简单了有没有。
•了解一下复数
我们把形如 这样的数叫做复数,复数集合用 来表示。其中 称为实部 , 称为虚部 , 为虚数单位,指满足 的一个解 ;此外,对于这样对复数开偶次幂的数叫做虚数 。
每一个复数 都对应了一个平面上的向量 我们把这样的平面称为复平面 ,它是由水平的实轴与垂直的虚轴建立起来的复数的几何表示。所以,每一个复数唯一对应了一个复平面上的向量,每一个复平面上的向量也唯一对应了一个复数。其中 既被认为是实数,也被认为是虚数。其中复数 的模长 定义为 在复平面的距离到原点的距离,即 。幅角 为实轴的正半轴正方向(逆时针)旋转到 的有向角度。由于虚数无法比较大小。复数之间的大小关系只存在等于与不等于两种关系,两个复数相等当且仅当实部虚部对应相等。对于虚部为 的复数之间是可以比较大小的,相当于实数之间的比较。
复数之间的运算满足结合律,交换律和分配律,由此定义复数之间的运算法则,如下:
复数运算的加法满足平行四边形法则,乘法满足幅角相加,模长相乘。
对于一个复数 ,它的共轭复数是 , 称为 的复共轭 。共轭复数有一些性质: 以及
复数中的单位根
上图是复平面中的单位圆。其中 单位根,表示为 ,可知 (顺便一提著名的欧拉幅角公式 其实是由定义来的...)。将单位圆等分成 个部分(以单位圆与实轴正半轴的交点一个等分点),以原点为起点,圆的这 个 等分点为终点,作出 个向量。其中幅角为正且最小的向量称为 次单位向量,记为 。其余的 个向量分别为 ,它们可以由复数之间的乘法得来 。
由此我们容易看出 ,且 ,带入上方即:
关于单位根有两个性质我们要谈谈
(一)性质一:折半定理,其中,它的数学表示: 。
证明不难,我们可以由单位根的几何意义证明,这两者表示的向量终点是一样的。我们还可以通过计算公式来证明,如下:
,从而引申出 。
(二)性质二:消去引理,其中,它的数学表示:
证明也不难,我们可以由几何意义,这两者表示的向量终点是相反的,左边较右边在单位圆上多转了半圈。我们也可以通过计算公式来证明,如下:
•离散傅里叶变换(DFT)
在讲快速傅里叶变换之前,我们还得来提一下离散傅里叶变换,首先我们单独考虑一个 项( )的多项式 ,其系数向量为 。我们将 次单位根的 ~ 次幂分别带入 得到其点值向量 。这个过程称为离散傅里叶变换
如果朴素带入,时间复杂度也是 的。所以我们必须要利用到单位根 的特殊性质。
对于 考虑将其按照奇偶分组得到如下
此时,令
则可以得到,这里就有一个结论:任何一个DFT其实可以重新改写成两个DFT的和
这里我们进行推导,分类讨论
注意, 与 取遍了 中的 个整数,保证了可以由这 个点值反推解出系数(上文已证明)。于是我们可以知道。如果已知了 分别在 的取值,可以在 的时间内求出 的取值。而 都是 一半的规模,显然可以转化为子问题递归求解。时间复杂度:
•离散傅里叶逆变换
我们已经把快速傅里叶变换的第一步,两个函数做傅立叶变换,之后算出它们的乘积的第一步完成,接下来,我们需要在对结果进行一次傅里叶逆变换求得结果,所以我们还需要了解傅里叶逆变换。正如这里所说,使用快速傅里叶变换将点值表示的多项式转化为系数表示,这个过程叫做离散傅里叶反变换。
即由 维点值向量 推出 维系数向量 。这里设 为 得到离散傅里叶变换的结果。从而我们可以构造一个多项式,如下:
于是,我们可以进行一下一系列的过程,如下:
由此得到,对于多项式 由插值节点 做离散傅里叶变换得到的点值向量 。我们将 作为插值节点, 作为系数向量,做一次离散傅里叶变换得到的向量每一项都除以 之后得到的 就是多项式的系数向量 。
注意到 是 的共轭复数。这整个推导过程称为离散傅里叶逆变换。
•快速傅里叶变换实现
在傅里叶变换和傅里叶逆变换结合使用的过程,就是快速傅里叶变换的实现。我们先通俗的讲一下结论,在进行推导,通过上面的奇偶分解,我们发现这一分为二的DFT组,一个是原来是偶数项(第0,2,4,6...项)组成的,而另一个是由原来的奇数项(odd)组成的。如果你只是看到这一步,你已经发现了一个大事情,就是原来用这个公式来算的话,求一个傅里叶变换不再需要进行N次相乘,而只需要odd组的N/2次运算,even组的直接不用做任何运算直接拉下来就好了。那这样计算量不就减少一半了吗?但是其实事情并没有那么简单,我们刚才证明了任何一个DFT组都能被一分为二,而且计算量减半。但是我们现在一分为二得到的even组和odd组,他们不又是DFT组吗?我们可以继续之前的操作,将他们分别再次分为两个数组的求和!是不是很惊讶,为了更好的理解,我这里形象的放一张图。
一分为二,二分为四,四分为八,一直分到每个数组只剩一个数字为止!而且每进行一次操作,就能使得其中一半的计算量被减少。这样我们就把计算量从 降到了 。
我相信如果搞懂了FFT,一定会让你精神抖擞,你将会被它的快速而惊艳到,下面我贴几种方式的源码实现(只是核心的递归代码,我们理解思想就好)
Fortran源码
recursive subroutine fft(x,sgn)
implicit none
integer, intent(in) :: sgn
complex(8), dimension(:), intent(inout) :: x
complex(8) :: t
integer :: N
integer :: i
complex(8), dimension(:), allocatable :: even, odd
N=size(x)
if(N .le. 1) return
allocate(odd((N+1)/2))
allocate(even(N/2))
! divide
odd =x(1:N:2)
even=x(2:N:2)
! conquer
call fft(odd, sgn)
call fft(even, sgn)
! combine
do i=1,N/2
t=exp(cmplx(0.0d0,sgn*2.0d0*pi*(i-1)/N))*even(i)
x(i) = odd(i) + t
x(i+N/2) = odd(i) - t
end do
deallocate(odd)
deallocate(even)
end subroutine fft
C++代码
struct Complex {
double r, i ;
Complex ( ) { }
Complex ( double r, double i ) : r ( r ), i ( i ) { }
inline void real ( const double& x ) { r = x ; }
inline double real ( ) { return r ; }
inline Complex operator + ( const Complex& rhs ) const {
return Complex ( r + rhs.r, i + rhs.i ) ;
}
inline Complex operator - ( const Complex& rhs ) const {
return Complex ( r - rhs.r, i - rhs.i ) ;
}
inline Complex operator * ( const Complex& rhs ) const {
return Complex ( r * rhs.r - i * rhs.i, r * rhs.i + i * rhs.r ) ;
}
inline void operator /= ( const double& x ) {
r /= x, i /= x ;
}
inline void operator *= ( const Complex& rhs ) {
*this = Complex ( r * rhs.r - i * rhs.i, r * rhs.i + i * rhs.r ) ;
}
inline void operator += ( const Complex& rhs ) {
r += rhs.r, i += rhs.i ;
}
inline Complex conj ( ) {
return Complex ( r, -i ) ;
}
} ;
struct FastFourierTransform {
Complex omega [N], omegaInverse [N] ;
void init ( const int& n ) {
for ( int i = 0 ; i < n ; ++ i ) {
omega [i] = Complex ( cos ( 2 * PI / n * i), sin ( 2 * PI / n * i ) ) ;
omegaInverse [i] = omega [i].conj ( ) ;
}
}
void transform ( Complex *a, const int& n, const Complex* omega ) {
for ( int i = 0, j = 0 ; i < n ; ++ i ) {
if ( i > j ) std :: swap ( a [i], a [j] ) ;
for( int l = n >> 1 ; ( j ^= l ) < l ; l >>= 1 ) ;
}
for ( int l = 2 ; l <= n ; l <<= 1 ) {
int m = l / 2;
for ( Complex *p = a ; p != a + n ; p += l ) {
for ( int i = 0 ; i < m ; ++ i ) {
Complex t = omega [n / l * i] * p [m + i] ;
p [m + i] = p [i] - t ;
p [i] += t ;
}
}
}
}
void dft ( Complex *a, const int& n ) {
transform ( a, n, omega ) ;
}
void idft ( Complex *a, const int& n ) {
transform ( a, n, omegaInverse ) ;
for ( int i = 0 ; i < n ; ++ i ) a [i] /= n ;
}
} fft ;