小学生都能看懂的FFT！！！

欢迎光临程序代写小店https://item.taobao.com/item.htm?spm=a230r.1.14.59.255028c3ALNkZ0&id=586797758241&ns=1&abbucket=15#detail

可直接联系客服QQ交代需求：953586085

欢迎点击链接加入群聊【程序代写-接单群】共同致富：https://jq.qq.com/?_wv=1027&k=5WxihsL

群号：733065427

在创新实践重心偷偷看了一天FFT资料后，我终于看懂了一点。为了给大家提供一份简单易懂的学习资料，同时也方便自己以后复习，我决定动手写这份学习笔记。

食用指南：
本篇受众：如标题所示，另外也面向同我一样高中起步且非常菜的OIer。真正的dalao请无视。
本篇目标：让大家（和不知道什么时候把FFT忘了的我）在没有数学基础的情况下，以最快的速度了解并会写 FFT。因此本篇将采用尽可能通俗易懂的语言，且略过大部分数学证明，在严谨性上可能有欠缺。但如果您发现了较大的逻辑漏洞，欢迎在评论里指正！

最后……来个版权声明吧。本文作者胡小兔，博客地址http://rabbithu.cnblogs.com。暂未许可在任何其他平台转载。

你一定听说过FFT，它的高逼格名字让人望而却步——“快速傅里叶变换”。
你可能知道它可以O(nlogn)O(nlog⁡n) 求高精度乘法，你想学，可是面对一堆公式，你无从下手。
那么欢迎阅读这篇教程！

[Warning] 本文涉及复数（虚数）的一小部分内容，这可能是最难的部分，但只要看下去也不是非常难，请不要看到它就中途退出啊QAQ。

什么是FFT？

快速傅里叶变换（FFT）是一种能在O(nlogn)O(nlog⁡n) 的时间内将一个多项式转换成它的点值表示的算法。

补充资料：什么是点值表示

设A(x)A(x) 是一个n−1n−1 次多项式，那么把nn 个不同的xx 代入，会得到nn 个yy 。这nn 对(x,y)(x,y) 唯一确定了该多项式，即只有一个多项式能同时满足“代入这些xx ，得到的分别是这些yy ”。
由多项式可以求出其点值表示，而由点值表示也可以求出多项式。

（并不想证明，十分想看证明的同学请前往“参考资料”部分）。

注：下文如果不加特殊说明，默认所有nn 为2的整数次幂。如果一个多项式次数不是2的整数次幂，可以在后面补0。

为什么要使用FFT？

FFT可以用来加速多项式乘法（平时非常常用的高精度大整数乘法就是最终把x=10x=10 代入的多项式乘法）。

假设有两个n−1n−1 次多项式A(x)A(x) 和B(x)B(x) ，我们的目标是——把它们乘起来。

普通的多项式乘法是O(n2)O(n2) 的——我们要枚举A(x)A(x) 中的每一项，分别与B(x)B(x) 中的每一项相乘，来得到一个新的多项式C(x)C(x) 。

但有趣的是，两个用点值表示的多项式相乘，复杂度是O(n)O(n) 的！具体方法：C(xi)=A(xi)×B(xi)C(xi)=A(xi)×B(xi) ，所以O(n)O(n) 枚举xixi 即可。

要是我们把两个多项式转换成点值表示，再相乘，再把新的点值表示转换成多项式岂不就可以O(n)O(n) 解决多项式乘法了！

……很遗憾，显然，把多项式转换成点值表示的朴素算法是O(n2)O(n2) 的。另外，即使你可能不会——把点值表示转换为多项式的朴素“插值算法”也是O(n2)O(n2) 的。

难道大整数乘法就只能是O(n2)O(n2) 吗？！不甘心的同学可以发现，大整数乘法复杂度的瓶颈可能在“多项式转换成点值表示”这一步（以及其反向操作），只要完成这一步就可以O(n)O(n) 求答案了。如果能优化这一步，岂不美哉？

傅里叶：这个我会！

离散傅里叶变换（快速傅里叶变换的朴素版）

傅里叶发明了一种办法：规定点值表示中的nn 个xx 为nn 个模长为11 的复数。

——等等，先别看到复数就走！

补充资料：什么是复数

如果你学过复数，这段不用看了；
如果你学过向量，请把复数理解成一个向量；
如果你啥都没学过，请把复数理解成一个平面直角坐标系上的点。

复数具有一个实部和一个虚部，正如一个向量（或点）有一个横坐标和一个纵坐标。例如复数3+2i3+2i ，实部是33 ，虚部是22 ，i=−1−−−√i=−1 。可以把它想象成向量(3,2)(3,2) 或点(3,2)(3,2) 。

但复数比一个向量或点更妙的地方在于——复数也是一种数，它可以像我们熟悉的实数那样进行加减乘除等运算，还可以代入多项式A(x)A(x) ——显然你不能把一个向量或点作为xx 代入进去。

复数相乘的规则：模长相乘，幅角相加。模长就是这个向量的模长（或是这个点到原点的距离）；幅角就是x轴正方向逆时针旋转到与这个向量共线所途径的角（或是原点出发、指向x轴正方向的射线逆时针旋转至过这个点所经过的角）。想学会FFT，“模长相乘”暂时不需要了解过多，但“幅角相加”需要记住。

C++的STL提供了复数模板！
头文件：#include <complex>
定义： complex<double> x;
运算：直接使用加减乘除。

傅里叶要用到的nn 个复数，不是随机找的，而是——把单位圆（圆心为原点、1为半径的圆）nn 等分，取这nn 个点（或点表示的向量）所表示的虚数，即分别以这nn 个点的横坐标为实部、纵坐标为虚部，所构成的虚数。

从点(1,0)(1,0) 开始（显然这个点是我们要取的点之一），逆时针将这nn 个点从00 开始编号，第kk 个点对应的虚数记作ωknωnk （根据复数相乘时模长相乘幅角相加可以看出，ωknωnk 是ω1nωn1 的kk 次方，所以ω1nωn1 被称为nn 次单位根）。

根据每个复数的幅角，可以计算出所对应的点/向量。ωknωnk 对应的点/向量是(coskn2π,sinkn2π)(cos⁡kn2π,sin⁡kn2π) ，也就是说这个复数是coskn2π+isinkn2πcos⁡kn2π+isin⁡kn2π 。

傅里叶说：把nn 个复数ω0n,ω1n,ω2n,...,ωn−1nωn0,ωn1,ωn2,...,ωnn−1 代入多项式，能得到一种特殊的点值表示，这种点值表示就叫离散傅里叶变换吧！

[Warning] 从现在开始，本文个别部分会集中出现数学公式，但是都不是很难，公式恐惧症患者请坚持！Stay Determined！

补充资料：单位根的性质

性质一：ω2k2n=ωknω2n2k=ωnk

证明：它们对应的点/向量是相同的。

性质二：ωk+n2n=−ωknωnk+n2=−ωnk

证明：它们对应的点是关于原点对称的（对应的向量是等大反向的）。

为什么要使用单位根作为xx 代入

当然是因为离散傅里叶变换有着特殊的性质啦。

[Warning] 下面有一些证明，如果不想看，请跳到加粗的“一个结论”部分。

设(y0,y1,y2,...,yn−1)(y0,y1,y2,...,yn−1) 为多项式A(x)=a0+a1x+a2x2+...+an−1xn−1A(x)=a0+a1x+a2x2+...+an−1xn−1 的离散傅里叶变换。

现在我们再设一个多项式B(x)=y0+y1x+y2x2+...+yn−1xn−1B(x)=y0+y1x+y2x2+...+yn−1xn−1 ，现在我们把上面的nn 个单位根的倒数，即ω0n,ω−1n,ω−2n,...,ω−(n−1)nωn0,ωn−1,ωn−2,...,ωn−(n−1) 作为xx 代入B(x)B(x) , 得到一个新的离散傅里叶变换(z0,z1,z2,...,zn−1(z0,z1,z2,...,zn−1 )。

zk=∑i=0n−1yi(ω−kn)i=∑i=0n−1(∑j=0n−1aj(ωin)j)(ω−kn)i=∑j=0n−1aj(∑i=0n−1(ωj−kn)i)zk=∑i=0n−1yi(ωn−k)i=∑i=0n−1(∑j=0n−1aj(ωni)j)(ωn−k)i=∑j=0n−1aj(∑i=0n−1(ωnj−k)i)

这个∑n−1i=0(ωj−kn)i∑i=0n−1(ωnj−k)i 是可求的：当j−k=0j−k=0 时，它等于nn ; 其余时候，通过等比数列求和可知它等于(ωj−kn)n−1ωj−kn−1=(ωnn)j−k−1ωj−kn−1=1j−k−1ωj−kn−1=0(ωnj−k)n−1ωnj−k−1=(ωnn)j−k−1ωnj−k−1=1j−k−1ωnj−k−1=0 。

那么，zkzk 就等于naknak , 即：

ai=zinai=zin

一个结论

把多项式A(x)A(x) 的离散傅里叶变换结果作为另一个多项式B(x)B(x) 的系数，取单位根的倒数即ω0n,ω−1n,ω−2n,...,ω−(n−1)nωn0,ωn−1,ωn−2,...,ωn−(n−1) 作为xx 代入B(x)B(x) ，得到的每个数再除以n，得到的是A(x)A(x) 的各项系数。这实现了傅里叶变换的逆变换——把点值表示转换成多项式系数表示，这就是离散傅里叶变换神奇的特殊性质。

快速傅里叶变换

虽然傅里叶发明了神奇的变换，能把多项式转换成点值表示又转换回来，但是……它仍然是暴力代入的做法，复杂度仍然是O(n2)O(n2) 啊！（傅里叶：我都没见过计算机，我干啥要优化复杂度……）

于是，快速傅里叶变换应运而生。它是一种分治的傅里叶变换。

[Warning] 下面有较多公式。看起来很吓人，但是并不复杂。请坚持看完。

快速傅里叶变换的数学证明

仍然，我们设A(x)=a0+a1x+a2x2+...+an−1xn−1A(x)=a0+a1x+a2x2+...+an−1xn−1 ，现在为了求离散傅里叶变换，要把一个x=ωknx=ωnk 代入。

考虑将A(x)A(x) 的每一项按照下标的奇偶分成两部分：

A(x)=(a0+a2x2+...+an−2xn−2)+(a1x+a3x3+...+an−1xn−1)A(x)=(a0+a2x2+...+an−2xn−2)+(a1x+a3x3+...+an−1xn−1)

设两个多项式：

A1(x)=a0+a2x+...+an−2xn2−1A1(x)=a0+a2x+...+an−2xn2−1

A2(x)=a1+a3x+...+an−1xn2−1A2(x)=a1+a3x+...+an−1xn2−1

则：

A(x)=A1(x2)+xA2(x2)A(x)=A1(x2)+xA2(x2)

假设k<n2k<n2 ，现在要把x=ωknx=ωnk 代入：

A(ωkn)=A1(ω2kn)+ωknA2(ω2kn)=A1(ωkn2)+ωknA2(ωkn2)A(ωnk)=A1(ωn2k)+ωnkA2(ωn2k)=A1(ωn2k)+ωnkA2(ωn2k)

那么对于A(ωk+n2n)A(ωnk+n2) ：

A(ωk+n2n)=A1(ω2k+nn)+ωk+n2nA2(ω2k+nn)=A1(ωkn2×ωnn)+ωk+n2nA2(ωkn2×ωnn)=A1(ωkn2)−ωknA2(ωkn2)A(ωnk+n2)=A1(ωn2k+n)+ωnk+n2A2(ωn2k+n)=A1(ωn2k×ωnn)+ωnk+n2A2(ωn2k×ωnn)=A1(ωn2k)−ωnkA2(ωn2k)

所以，如果我们知道两个多项式A1(x)A1(x) 和A2(x)A2(x) 分别在(ω0n2,ω1n2,ω2n2,...,ωn2−1n2(ωn20,ωn21,ωn22,...,ωn2n2−1 )的点值表示，就可以O(n)O(n) 求出A(x)A(x) 在ω0n,ω1n,ω2n,...,ωn−1nωn0,ωn1,ωn2,...,ωnn−1 处的点值表示了。而A1(x)A1(x) 和A2(x)A2(x) 都是规模缩小了一半的子问题。分治边界是n=1n=1 ，此时直接return。

快速傅里叶变换的实现

写个递归就可以实现一个FFT了！

cp omega(int n, int k){
    return cp(cos(2 * PI * k / n), sin(2 * PI * k / n));
}
void fft(cp  *a, int n, bool inv){
    if(n == 1) return;
    static cp buf[N];
    int m = n / 2;
    for(int i = 0; i < m; i++){ //将每一项按照奇偶分为两组
        buf[i] = a[2 * i];
        buf[i + m] = a[2 * i + 1];
    }
    for(int i = 0; i < n; i++)
        a[i] = buf[i];
    fft(a, m, inv); //递归处理两个子问题
    fft(a + m, m, inv);
    for(int i = 0; i < m; i++){ //枚举x，计算A(x)
        cp x = omega(n, i); 
        if(inv) x = conj(x); 
        //conj是一个自带的求共轭复数的函数，精度较高。当复数模为1时，共轭复数等于倒数
        buf[i] = a[i] + x * a[i + m]; //根据之前推出的结论计算
        buf[i + m] = a[i] - x * a[i + m];
    }
    for(int i = 0; i < n; i++)
        a[i] = buf[i];
}

inv表示这次用的单位根是否要取倒数。

至此你已经会写fft了！但是这个fft还是1.0版本，比较慢（可能同时还比较长？），亲测可能会比加了一些优化的fft慢了4倍左右……

那么我们来学习一些优化吧！

优化fft

非递归fft

在进行fft时，我们要把各个系数不断分组并放到两侧，那么一个系数原来的位置和最终的位置有什么规律呢？

初始位置：0 1 2 3 4 5 6 7
第一轮后：0 2 4 6|1 3 5 7
第二轮后：0 4|2 6|1 5|3 7
第三轮后：0|4|2|6|1|5|3|7

“|”代表分组界限。

可以发现（这你都能发现？），一个位置a上的数，最后所在的位置是“a二进制翻转得到的数”，例如6(011)最后到了3(110)，1(001)最后到了4(100)。

那么我们可以据此写出非递归版本fft：先把每个数放到最后的位置上，然后不断向上还原，同时求出点值表示。

代码：

cp a[N], b[N], omg[N], inv[N];

void init(){
    for(int i = 0; i < n; i++){
        omg[i] = cp(cos(2 * PI * i / n), sin(2 * PI * i / n));
        inv[i] = conj(omg[i]);
    }
}
void fft(cp *a, cp *omg){
    int lim = 0;
    while((1 << lim) < n) lim++;
    for(int i = 0; i < n; i++){
        int t = 0;
        for(int j = 0; j < lim; j++)
            if((i >> j) & 1) t |= (1 << (lim - j - 1));
        if(i < t) swap(a[i], a[t]); // i < t 的限制使得每对点只被交换一次（否则交换两次相当于没交换）
    }
    static cp buf[N];
    for(int l = 2; l <= n; l *= 2){
        int m = l / 2;
        for(int j = 0; j < n; j += l)
            for(int i = 0; i < m; i++){
                buf[j + i] = a[j + i] + omg[n / l * i] * a[j + i + m];
                buf[j + i + m] = a[j + i] - omg[n / l * i] * a[j + i + m];
        }
        for(int j = 0; j < n; j++)
            a[j] = buf[j];
    }
}

可以预处理ωknωnk 和ω−knωn−k ，分别存在omg和inv数组中。调用fft时，如果无需取倒数，则传入omg；如果需要取倒数，则传入inv。

蝴蝶操作

这个优化有着一个高大上的名字——“蝴蝶操作”。我第一次看到这个名字时就吓跑了——尤其是看到那种带示意图的蝴蝶操作解说时。

但是你完全无需跑！这是一个很简单的优化，它可以丢掉上面代码里的那个buf数组。

我们为什么需要buf数组？因为我们要做这两件事：

a[j + i] = a[j + i] + omg[n / l * i] * a[j + i + m]
a[j + i + m] = a[j + i] - omg[n / l * i] * a[j + i + m]

但是我们又要求这两行不能互相影响，所以我们需要buf数组。

但是如果我们这样写：

cp t = omg[n / l * i] * a[j + i + m]
a[j + i + m] = a[j + i] - t
a[j + i] = a[j + i] + t

就可以原地进行了，不需要buf数组。

cp a[N], b[N], omg[N], inv[N];

void init(){
    for(int i = 0; i < n; i++){
        omg[i] = cp(cos(2 * PI * i / n), sin(2 * PI * i / n));
        inv[i] = conj(omg[i]);
    }
}
void fft(cp *a, cp *omg){
    int lim = 0;
    while((1 << lim) < n) lim++;
    for(int i = 0; i < n; i++){
        int t = 0;
        for(int j = 0; j < lim; j++)
            if((i >> j) & 1) t |= (1 << (lim - j - 1));
        if(i < t) swap(a[i], a[t]); // i < t 的限制使得每对点只被交换一次（否则交换两次相当于没交换）
    }
    for(int l = 2; l <= n; l *= 2){
    int m = l / 2;
    for(cp *p = a; p != a + n; p += l)
        for(int i = 0; i < m; i++){
            cp t = omg[n / l * i] * p[i + m];
            p[i + m] = p[i] - t;
            p[i] += t;
        }
    }
}

现在，这个fft就比之前的递归版快很多了！

到此为止我的FFT笔记就整理完啦。

下面贴一个FFT加速高精度乘法的代码：

#include <cstdio>
#include <cmath>
#include <cstring>
#include <algorithm>
#include <complex>
#define space putchar(' ')
#define enter putchar('\n')
using namespace std;
typedef long long ll;
template <class T>
void read(T &x){
    char c;
    bool op = 0;
    while(c = getchar(), c < '0' || c > '9')
    if(c == '-') op = 1;
        x = c - '0';
    while(c = getchar(), c >= '0' && c <= '9')
        x = x * 10 + c - '0';
    if(op) x = -x;
}
template <class T>
void write(T x){
    if(x < 0) putchar('-'), x = -x;
    if(x >= 10) write(x / 10);
    putchar('0' + x % 10);
}
const int N = 1000005;
const double PI = acos(-1);
typedef complex <double> cp;
char sa[N], sb[N];
int n = 1, lena, lenb, res[N];
cp a[N], b[N], omg[N], inv[N];
void init(){
    for(int i = 0; i < n; i++){
        omg[i] = cp(cos(2 * PI * i / n), sin(2 * PI * i / n));
        inv[i] = conj(omg[i]);
    }
}
void fft(cp *a, cp *omg){
    int lim = 0;
    while((1 << lim) < n) lim++;
    for(int i = 0; i < n; i++){
        int t = 0;
        for(int j = 0; j < lim; j++)
            if((i >> j) & 1) t |= (1 << (lim - j - 1));
        if(i < t) swap(a[i], a[t]); // i < t 的限制使得每对点只被交换一次（否则交换两次相当于没交换）
    }
    for(int l = 2; l <= n; l *= 2){
        int m = l / 2;
    for(cp *p = a; p != a + n; p += l)
        for(int i = 0; i < m; i++){
            cp t = omg[n / l * i] * p[i + m];
            p[i + m] = p[i] - t;
            p[i] += t;
        }
    }
}
int main(){
    scanf("%s%s", sa, sb);
    lena = strlen(sa), lenb = strlen(sb);
    while(n < lena + lenb) n *= 2;
    for(int i = 0; i < lena; i++)
        a[i].real(sa[lena - 1 - i] - '0');
    for(int i = 0; i < lenb; i++)
        b[i].real(sb[lenb - 1 - i] - '0');
    init();
    fft(a, omg);
    fft(b, omg);
    for(int i = 0; i < n; i++)
        a[i] *= b[i];
    fft(a, inv);
    for(int i = 0; i < n; i++){
        res[i] += floor(a[i].real() / n + 0.5);
        res[i + 1] += res[i] / 10;
        res[i] %= 10;
    }
    for(int i = res[lena + lenb - 1] ? lena + lenb - 1: lena + lenb - 2; i >= 0; i--)
        putchar('0' + res[i]);
    enter;
    return 0;
}