等价类计数：Burnside引理 & Polya定理

提示: 本文并非严谨的数学分析，有很多地方是自己瞎口胡的，仅供参考。有错误请不吝指出 :p

1. 群

1.1 群的概念

群 $(S,\circ)$ 是一个元素集合 $S$ 和一种二元运算 $ \circ $ 的合称，其满足以下性质。

封闭性

对于 $\forall a,b \in S$ ， $\exist c \in S$ 使得 $c = a \circ b$

结合律

对于 $\forall a,b,c \in S$ ， $a \circ (b \circ c) = (a \circ b) \circ c$

单位元

$\exist I \in S$ ，使得对于 $\forall a \in S$ ， $a \circ I = I \circ a = a$

根据定义，单位元具有唯一性，即一个群只有一个单位元。

证明：设 $a,b$ 都是 $S$ 的单位元，则 $a = a \circ b = b$ ，两者实质上相同。

逆元

对于 $\forall a \in S$ ， $\exist a^{-1} \in S$ ，使得 $a \circ a^{-1} = a^{-1} \circ a = I$

根据定义，逆元具有唯一性，即每个元素有且仅有一个逆元。

证明：设 $a$ 有两个逆元 $b,c$ ，则 $b = b \circ I = b \circ (a \circ c) = (b \circ a) \circ c = I \circ c = c$ ，两者实质相同。

这也同时说明了不存在两个元素 $a, b$ 的逆元是同一个元素 $c$，因为 $c$ 只有唯一一个逆元。

即逆元是一一对应的。

1.2 更抽象的群

我们更进一步，将 $S$ 中的每一个元素视为一个函数，默认 $\circ$ 代表函数的复合，即 $(f \circ g) (x) = f(g(x))$。所以现在一个群可以只用一个函数集合 $S$ 来表示。

例如，记 $r_\theta (x)$ 表示将 $x$ 旋转 $\theta$ 度，那么 $S = \{ r_{0^\circ}, r_{90^\circ},r_{180^\circ},r_{270^\circ}\}$ 就是一个群。

证明一下，显然有封闭性和结合律。

单位元是 $r_{0^\circ}$ ，因为 $r_{0^\circ} (r_\theta(x)) = r_{\theta^\circ} (r_0 (x)) = r_\theta(x)$

$S$ 中元素 $r_\theta $ 的逆元便是 $r_{360^\circ - \theta}$ ，因为他们两个卷起来就是 $I = r_{0^{\circ}}$

1.3 提示

由于群满足封闭性，所以我们在寻找群的时候一定要“找完”所有可能的状态，例如 $\{ r_{0^\circ}, r_{90^\circ}\}$ 就不是一个群。

2. Burnside

首先明确这个定理是用来干什么的——等价类计数。

注：通常我使用 $a,b,c,d \in C$ 表示计数对象， $f,g,h \in G$ 表示变换。

2.1 等价

给定一个作用在计数集合 $C$ 上的变换集合 $G$，若 $C$ 中计数对象 $d$ 可以由计数对象 $c$ 通过 $G$ 中变换得到，即 $\exist f \in G$ 使得 $d = c \circ f$，我们便称 $c$ 与 $d$ 等价，记作 $c \sim d$ 。

$G$ 其实就是个函数集合，其中的函数都接受 $C$ 中元素作为参数，输出也是 $C$ 中元素。

类似的我们记 $f(c)$ 为 $c \circ f$ ，表示对计数对象 $c$ 做变换 $f$ 。

我们同样可以对一个函数做变换，即 $f \circ g$ 是允许的。请参考上文“1.2 更抽象的群”。

在Burnside中，我们要求 $G$ 是一个群。这样我们可以导出一些关于等价的性质。

自反性

$a \sim a$

因为 $G$ 是群，故有单位元 $I \in G$ ， $a \circ I = a$ ，满足等价定义。

对称性

$a \sim b \iff b \sim a$

设 $a \circ f = b$ ，因为 $G$ 是群，故存在 $f^{-1}$ 使得 $b \circ f^{-1} = a$ ，满足等价定义。同理反向再证一次即可得出充分完全性。

传递性

$a \sim b , b \sim c \Rightarrow a \sim c$

设 $a \circ f = b, b \circ g = c$，因为 $G$ 是群，所以 $f \circ g \in G$（封闭性），$a \circ (f \circ g) = (a \circ f) \circ g = b \circ g = c$，满足等价定义。

2.2 等价类及等价类计数

等价类即所有等价的计数元素的集合。计数集合 $C$ 由许多个等价类构成，好比连通块。统计 $C$ 中有多少个等价类，就是等价类计数。

如何快速的等价类计数，便是我们接下来所研究的。

2.3 弱化版

不妨先来研究一个弱化版本，这可以帮助我们捋清思路。

2.3.1 引理

若对于 $\forall c \in C,f \in G \quad (f \not= I)$ ， $c \circ f \not= c$ 都成立，那么对于 $\forall c \in C, f \in G,g \in G \quad (f \not= g)$ ，都有 $c \circ f \not= c \circ g$ ，即与 $\forall c$ 等价的元素有且仅有 $|G|$ 个。

利用反证法。若 $\exist c,f,g$ 使得 $c \circ f = c \circ g$ ，那么有 $c \circ f \circ g^{-1} = c$ ，即 $c \circ (f \circ g^{-1}) = c$ 。同时因为 $f \not= g$ ，所以 $f \circ g^{-1} \not= I$ 。于是与假设产生矛盾，故引理成立。

对 $c$ 做变换得到的元素两两不同，共有 $|G|$ 种变换，故有且仅有 $|G|$ 个元素与 $c$ 等价。

2.3.2 弱化版Burnside

若对于 $\forall c \in C,f \in G \quad (f \not= I)$ ， $c \circ f \not= c$ 都成立，那么
\[ 等价类计数 = \frac{|C|}{|G|} \]

这是肉眼可得的结论。由引理，对于 $\forall c$ ，都有且仅有 $|G|$ 个互不相同的元素与其等价。由于等价的传递性，这 $|G|$ 个元素是封闭的，实质上形成了许多个大小为 $|G|$ 的等价类。那么等价类个数自然就是总计数元素个数 $|C|$ 除以每个等价类的大小 $|G|$ 了。

2.4 标准版

弱化版的关键之处在于引理， $c \circ f \not= c$ 让我们知道每个 $c$ 有 $|G|$ 个互不相同的元素与其等价。我们将这个条件和这个引理做一些“推广”。

2.4.1 稳定核 & 不动点

稳定核 $G(c)$ ：对于计数对象 $c$ ，使得 $c \circ f = c$ 的所有变换 $f$ 的集合，即 $\{ f \in G | c \circ f = c \}$

不动点 $C(f)$ ：对于变换 $f$ ，使得 $c \circ f = c$ 的所有计数对象 $c$ 的集合，即 $\{ c \in C | c \circ f = c \}$

注意单个字母 $G$ 代表整个变换集合；而 $G(c)$ 是根据计数元素 $c$ 生成的一个被 $G$ 包含的变换集合；

注意单个字母 $C$ 代表整个计数集合；而 $C(f)$ 是根据变换 $f$ 生成的一个被 $C$ 包含的计数集合。

2.4.2 引理1

\[ \sum_{c \in C} |G(c)| = \sum_{f \in G} |C(f)| \]

证明：
\[ \begin{aligned} \sum_{c \in C} |G(c)| &= \sum_{c \in C} \sum_{f \in G} [c \circ f = c] \\ &= \sum_{f \in G} \sum_{c \in C} [c \circ f = c] \\ &= \sum_{f \in G} |C(f)| \end{aligned} \]

其实质是更换枚举方式。

2.4.3 引理2

对于 $\forall c$ ， $G(c)$ 是个群。

分别证明群的四个性质即可。

封闭性

对于 $\forall f,g \in G(c)$ ， $c \circ (f \circ g) = (c \circ f) \circ g = c \circ g = c$ ，所以 $f \circ g \in G(c)$ 。封闭性得证。

结合律

$G(c) \subseteq G$ ，结合律直接由 $G$ 给出。

单位元

$c \circ I = c$ ，所以 $I \in G(c)$ 。（这里的 $I$ 代指 $G$ 的单位元）

逆元

对于 $\forall f \in G(c)$ ， $ c \circ f^{-1} = (c \circ f) \circ f^{-1} = c \circ (f \circ f^{-1}) = c$ ，所以 $f^{-1} \in G(c)$ 。

2.4.4 引理3

对于 $\forall c$ ，记 $S(c)$ 为与 $c$ 等价的计数元素的集合，有
\[ |S(c)| = \frac{|G|}{|G(c)|} \]

这个引理与弱化版引理2.3.1是对应关系。请对比起来理解。

我们的证明思路是：对于某个计数元素 $c$ ，求出对于某个确定的变换 $f$ ，有多少个变换 $g$ 与其作用效果相同，即 $c \circ f = c \circ g$ 。

\[ c \circ f = c \circ g \iff c \circ f \circ g^{-1} = c \iff (f \circ g^{-1}) \in G(c) \]

即 $f ,g$ 对 $c$ 的作用效果相同等价于 $f \circ g^{-1}$ 在 $c$ 的稳定核内。

于是对于一个变换 $h \in G(c)$ ，根据群的基本性质，存在唯一的 $g^{-1} = f^{-1} \circ h$ ，使得 $f \circ g^{-1} = h$ 。变换 $h \in G(c)$ ，所以有 $|G(c)|$ 种取值； $f$ 是确定的，根据逆元唯一性， $f^{-1}$ 也是确定的；故 $g^{-1}$ 有 $|G(c)|$ 种取值。又由于逆元的一一对应性， $g$ 有 $|G(c)|$ 种取值。

即对于 $\forall f$ ，都有且仅有 $|G(c)|$ 个 $g$ 与其作用效果相同。

这说明了什么？“作用效果相同”也是一种类似等价的关系，容易证明其具有传递性，于是他们是封闭的。作用效果相同的变换实质上形成 $\frac{|G|}{|G(c)|}$ 个大小为 $|G(c)|$ 的两两相连的连通块或者说“作用效果相同等价类”，合起来构成了整个 $G$ 。我们便知道了 $c$ 通过变换可以变出 $\frac{|G|}{|G(c)|}$ 个不同的计数元素，即与 $c$ 等价的元素有 $\frac{|G|}{|G(c)|}$ 个，引理3证毕。

2.4.5 Burnside

\[ 等价类计数 = \frac{1}{|G|}\sum_{f \in G} |C(f)| \]

\[ \begin{aligned} \frac{1}{|G|}\sum_{f \in G} |C(f)| &= \frac{1}{|G|}\sum_{c \in C} |G(c)| \quad &\text{...引理1} \\ &= \frac{1}{|G|}\sum_{c \in C} \frac{|G|}{|S(c)|} \quad &\text{...引理3} \\ &= \sum_{c \in C} \frac{1}{S(c)} \\ &= 等价类计数 \end{aligned} \]

倒数第二个式子，每个元素贡献 $\frac{1}{S(c)}$ ，合起来便是等价类计数。这便是等价类计数的本质。

2.5 Burnside的本质

来自zkx学长的课件《Polya计数.pptx》

直接除以4不行，因为前四种找不到4个等价的情况

所以强行把它们补成4个就行了。。。

Burnside就是“强行补”的过程

——zkx

Burnside的精髓就在于此。

Burnside弱化版，实际上是省掉了强行补的部分，使所有有效部分都在 $C(I)$ 。

可以发现“群”是Burnside的唯一约束

这个约束几乎就是没有约束。。。

所以Burnside是非常通用的等价类计数法

——zkx

3. 置换群

（Burnside的内容已经结束，这里开始是Polya了）

3.1 置换

一个置换长这样：
\[ (\begin{aligned} 1&,2,3,...,n \\ a_1&,a_2,a_3,...,a_n \end{aligned}) \]

其中 $a_1,a_2,a_3,...,a_n$ 是一个 $n$ 排列。置换是一个接受序列，输出序列的函数，它表示对每一个 $i$ ，将原序列第 $i$ 个数放到第 $a_i$ 个位置上。

3.2 移位置换

一个普通的移位置换长这样：
\[ \tau_n = (\begin{aligned} 1,2,3,...,n&-1,n \\ 2,3,4,...,&n,1 \end{aligned}) \]

即全员右移1位。很自然的可以拓展到 $k$ 位移位置换：
\[ \tau_n^k = (\begin{aligned} 1,2,3,...&,n-1,n \\ k,k+1,...,n&,1,...,k-1 \end{aligned}) \]

容易发现 $\tau_n^k$ 是 $k$ 个 $\tau_n$ 的复合，所以我们写成乘方的形式。

3.3 移位置换图

移位置换 $\tau_n^k$ 所形成的图：考虑将 $n$ 个点排成一个圆圈， $1$ 连 $k$ ， $2$ 连 $k+1$ ，...，$n$ 连 $k-1$ 。

tau_6^2移位置换图

如图便是 $\tau_6^2$ 形成的移位置换图，共有两个环。

3.4 移位置换环个数定理

$\tau_n^k$ 移位置换图中环的个数为 $\gcd(k,n)$ 。

证明的思路同样是已经使用多次的：求出对于一个数 $a$ ，有多少个数 $b$ 与它在同一个环内。

对于 $\forall a,b$ ， $a,b$ 在同一个环内的条件为
\[ \begin{aligned} a \equiv b + ik \pmod n &\iff \exist i,j \quad s.t. \quad a = b + ik + jn \\ &\iff \exist i,j \quad s.t. \quad ik + jn = a - b \\ &\iff \gcd(k,n) | (a-b) \quad \text{...裴蜀定理} \end{aligned} \]

最后两个式子之间的转化运用了二元整数解不定方程的有解条件，即裴蜀定理。

那么这样一来，对于 $\forall a$ ，显然有且仅有 $\frac{n}{\gcd(k,n)}$ 个数与它在同一环内，故共有 $\gcd(k,n)$ 个环。（“在同一环内”传递性导出的封闭性，这个方法在上文已经多次使用到）

4. Polya

4.1 概念

Polya是等价类计数的一个特殊版本，它的变换群 $G$ 是一个移位置换群，即
\[ G = \{ \tau_n^k \ | \ k \in [0,n), k \in Z \} \]

显然移位置换群是一个群废话，证明很简单，同样是证明群的四个性质，这里不再赘述。

用人话来说，Polya求解的一类问题计数基于一个环，而通过旋转环能够变得相同的方案算作一种（等价）。

比如经典的模板题：洛谷P4980 Polya定理

给定一个 $n$ 个点， $n$ 条边的环，有 $m$ 种颜色，给每个顶点染色，问有多少种本质不同的染色方案，答案对 $10^9+7$ 取模。

本质不同定义为：只需要不能通过旋转与别的染色方案相同。

4.2 推导

有了前面那么多的铺垫，大名鼎鼎的Polya定理现在已经可以自己动手推出来了！

先写出Burnside引理，并套入移位置换
\[ \begin{aligned} 等价类计数 &= \frac{1}{|G|}\sum_{f \in G} |C(f)| \\ &= \frac{1}{n}\sum_{i=1}^n |C(\tau_n^i)| \end{aligned} \]

注： $\tau_n^n = \tau_n^0$ ，上面从 $1$ 到 $n$ 的枚举是对的

$|C(\tau_n^i)|$ 是什么？

$\tau_n^i$ 的不动点的个数，即要求 $\tau_n^i$ 移位置换图里同一环上点颜色相同的方案数。（为了做置换后看上去和原来一样）

根据移位置换环个数定理， $\tau_n^i$ 有 $\gcd(n,i)$ 个环。有 $m$ 种颜色给 $\gcd(n,i)$ 个环去染，显然方案数为 $m^{\gcd(n,i)}$ 。我们不局限于本题推而广之，方案数是一个关于环个数 $\gcd(n,i)$ 的函数 $f(\gcd(n,i))$ 。（也可以是关于环大小 $\frac{n}{\gcd(n,i)}$ 的函数，反正最重要的参数是 $\gcd(n,i)$ ）

带入原式
\[ \frac{1}{n}\sum_{i=1}^n f(\gcd(n,i)) \]

诶！这个式子里面有 $\gcd$ ！

不用抑制住冲动，我们按照常见的莫反题目套路来。
\[ \begin{aligned} 等价类计数 &= \frac{1}{n}\sum_{i=1}^n f(\gcd(n,i)) \\ &= \frac{1}{n} \sum_{d|n} f(d) \sum_{i=1}^n [\gcd(n,i)=d] \quad &\text{...把gcd提出来枚举} \\ &= \frac{1}{n} \sum_{d|n} f(d) \sum_{i=1}^{\frac{n}{d}} [\gcd(\frac{n}{d},i)=1] \\ &= \frac{1}{n} \sum_{d|n} f(d) \varphi(\frac{n}{d}) \quad &\text{...欧拉函数定义} \end{aligned} \]

好恭喜你可以在 $O(\sqrt n)$ 的优秀时间复杂度里求得答案了！

4.3 实现

提示一下实现上的一些细节。

快速幂作为基本技巧就不提了；

欧拉函数直接质因数分解求即可。这里会遇到一个小问题：外面一层枚举因数，里面一层分解质因数，这不 $O(\sum_{d|n} \sqrt d)$ 了吗？

实际上似乎利用数列的放缩之类的黑科技可以证明一个比 $O(n)$ 更紧的上界是 $O(n^{\frac 3 4})$ ，而且实际上跑起来非常的快。（洛谷 $n=10^9$ ， $10^3$ 组数据可以随便跑过）

/*
洛谷P4980 Polya定理
sun123zxy
朴素写法
洛谷共2.08s
2019/12/24
*/
#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<ctime>
#include<cstdlib>
#include<algorithm>
#include<queue>
#include<vector>
#include<map>
#include<set>
using namespace std;
typedef long long ll;
ll Rd(){
    ll ans=0;char c=getchar();
    while(c<'0'||c>'9') c=getchar();
    while(c>='0'&&c<='9') ans=ans*10+c-'0',c=getchar();
    return ans;
}
const ll MOD=1E9+7;
ll QPow(ll x,ll up){
    x%=MOD;
    ll ans=1;
    while(up)
        if(up%2==0) x=x*x%MOD,up/=2;
        else ans=ans*x%MOD,up--;
    return ans;
}
ll Inv(ll x){return QPow(x,MOD-2);}

ll Phi(ll n){
    ll t=n;
    ll ans=1;
    for(ll i=2;i*i<=t;i++){
        ll c=0;
        while(t%i==0) t/=i,c++;
        if(c) ans=ans*(QPow(i,c)-QPow(i,c-1)+MOD)%MOD;
    }
    if(t>1) ans=ans*(t-1)%MOD;
    return ans;
}

ll N;
ll Polya(ll d){
    return QPow(N,d)*Phi(N/d)%MOD;
}
void Solve(){
    ll Ans=0;
    for(ll i=1;i*i<=N;i++){
        if(N%i==0){
            Ans+=Polya(i);
            if(i!=N/i) Ans+=Polya(N/i);
            Ans%=MOD;
        }
    }
    Ans=Ans*Inv(N)%MOD;
    printf("%lld\n",Ans);
}
int main(){
    ll T=Rd();while(T--){
        scanf("%lld",&N);
        Solve();
    }
    return 0;
}

不过当然有真正 $O(\sqrt n)$ 的写法。只需在最外层分解质因数，然后DFS的去枚举因数，这样就不用每次去分解 $\frac{n}{d}$ 啦！于是这种写法就当然比上面那种快很多了。

/*
洛谷P4980 Polya定理
sun123zxy
更优写法
洛谷共125ms
2019/12/24
*/
#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<ctime>
#include<cstdlib>
#include<algorithm>
#include<queue>
#include<vector>
#include<map>
#include<set>
using namespace std;
typedef long long ll;
int Rd(){
    int ans=0;char c=getchar();
    while(c<'0'||c>'9') c=getchar();
    while(c>='0'&&c<='9') ans=ans*10+c-'0',c=getchar();
    return ans;
}
const ll MOD=1E9+7;
ll QPow(ll x,ll up,bool isM=1){
    x%=MOD;
    ll ans=1;
    while(up){
        if(up%2==0) x=x*x,up/=2;
        else ans=ans*x,up--;
        if(isM) x%=MOD,ans%=MOD;
    }
    return ans;
}
ll Inv(ll x){return QPow(x,MOD-2);}

namespace Div{
    int p[30],c[30];
    int pN;
    void Div(int nb){
        pN=0;
        int t=nb;
        for(int i=2;1LL*i*i<=t;i++){
            if(t%i==0){
                p[++pN]=i,c[pN]=0;
                while(t%i==0) t/=i,c[pN]++;
            }
        }if(t>1) p[++pN]=t,c[pN]=1;
    }
}

int N;
ll Ans;
void DFS(int pos,ll d,ll phi){
    using namespace Div;
    if(pos==pN+1){
        Ans=(Ans+QPow(N,d)*phi)%MOD;
        return ;
    }
    ll tpow=1,tphi=QPow(p[pos],c[pos],0)-QPow(p[pos],c[pos]-1,0);
    for(int i=0;i<=c[pos];i++){
        DFS(pos+1,d*tpow,phi*tphi);
        tpow*=p[pos];
        if(i==c[pos]-1) tphi=1;
        else tphi/=p[pos];
    }
}
void Solve(){
    Div::Div(N);
    Ans=0;DFS(1,1,1);
    Ans=Ans*Inv(N)%MOD;
    printf("%lld\n",Ans);
}
int main(){
    int T=Rd();while(T--){
        scanf("%d",&N);
        Solve();
    }
    return 0;
}

5. 总结

对于大多数题目，Burnside & Polya通常是套在最表面的那一层皮，难点一般在求 $|C(f)|$ 或者 $f(\gcd(n,i))$ 的部分。

6. 参考及后记

zkx / keke / 彳亍学长的《Polya计数.pptx》

整个PPT思路非常清晰，可以看出keke学长对Polya有极其深入的理解。我学Burnside完全是照着这个PPT一点一点的看懂的。

彳亍来讲课的那个暑假可以说是真正让我在OI数学这一块有很多新的收获。感谢keke学长！

《算法导论》第三版 31.3节模运算

初稿写成后，在学习数论时偶然翻到这一节有对群的标准定义，发现自己之前的理解不够优秀。遂做了一些订正。

~~我之前把交换群认成群了然后自己yy了一套理论xD~~

一些想法

这大概是我最长的一篇博客了..

Burnside & Polya 最开始是2019暑假zkx学长为我们讲授。当时云里雾里，半懂不懂。12月的时候有将近一半的同学跑去PKUWC/THUWC了，剩我这个菜鸡在机房瞎颓（（（当时就花了一两天把zkx学长的PPT慢慢看懂了，做了最初的笔记。然后在接下来的几个月里修订完善。现在用一天半的时间把笔记写成了博客，又有了些新的理解，增加了弱化版及其证明。

概念多，证明绕，很容易掉进思维的陷阱。如果能一步一步把证明过程捋清楚，对思维能力的提升还是很大的。

任何推导的目的都是由已知得到未知。由哪些性质推得哪些结论，好比图论中的有向边，最后应该形成一个有向无环图。如果把这个DAG搞清楚了，才是真正弄清楚了结论的来龙去脉。

本文多次用到了“将等价类计数问题转换为有多少个元素与某个确定的元素等价，并利用等价传递性导出封闭性说明形成连通块”这一思想，很具有推广性。

OI里的数学相关知识，都给人一种人类智慧的感觉，还是满有意思的（

2020/03/21