积性函数小结

定义及前置芝士

数论函数：指定义域为正整数、定义域为复数的函数，在OI中这类函数的值域极大多数也为整数

积性函数：指对于数论函数\(f(x)\)和任意一对互质整数\(a,b\),均有性质\(f(ab)=f(a)f(b)\)。

在OI中，有一类经典的问题是求某个数论函数的值（或前缀和），它可能是像\(\mu,\varphi\)这样广为人所熟知的数论函数，也有可能是一些连完整的表达式都写不出来的函数，但是它们都有一个特点——它们都是积性函数。于是我们可以考虑一些特殊的方法将它们“筛”出来

线性筛求积性函数

积性函数的定义是基于互质的，而互质的一个特例就是其中一个数是质数，于是我们考虑在筛素数的时候来同时求出这个积性函数的值

具体的，我们记录\(low[i]\)表示\(i\)的最小质因子的最大次幂的数使得它仍然是\(i\)的因数，这个根据线筛素数可以很方便的维护，接下来就是根据当前的数和筛它的质数是否互质来处理。

根据上面的叙述不难发现我们其实只是关心此积性函数的下列值:\(f(1),f(p)(质数的初值),f(p^k)(若用来筛的素数与被筛的数不互质)\)，当然实际上很多时候\(f(p^k)\)的值都是从\(f(p^{k-1})\)递推得到的

奉上一段伪代码

rep(i,2,N)
{
    if (!nopri[i]) {pri[++tot]=i;low[i]=i;f[i]=...(根据定义);}
    int j;
    for (j=1;j<=tot&&i*pri[j]<=N;j++)
    {
        nopri[i*pri[j]]=1;
        if (i%pri[j])
        {
            low[i*pri[j]]=low[i];
            f[i*pri[j]]=f[i]*f[pri[j]];
        }
        else
        {
            low[i*pri[j]]=low[i]*pri[j];
            f[i*pri[j]]=f[i/low[i]]*f[low[i]*pri[j]]\\注意后者可能需要根据定义求得
            break;
        }
    }
}

(未尝试编译，可能会有问题，欢迎指出！）

杜教筛

线性筛的时间复杂度显然是\(O(n)\)的，在许多问题中已经是十分优秀的时间了

然而事实是总有毒瘤出题人写什么\(n\leq 10^9\)甚至更大，于是我们需要一些跟更优秀的做法

dls为我们提供了一种在\(O(n^{\frac{2}{3}})\)的时间内求积性函数前缀和的方法

对于一个积性函数\(f\)，找到两个方便求前缀和的积性函数\(g,h\)使得\(f*g=h\)，于是
\[ \begin{aligned} \sum_{i=1}^nf(i)=&\sum_{i=1}^n(h(i)-\sum_{d|i,d\neq i}(f(d)g(\frac{i}{d}))\\ =&H(n)-\sum_{i=1}^n\sum_{d|i,d\neq i}(f(d)g(\frac{i}{d}))\\ =&H(n)-\sum_{d=1}^nf(d)\sum_{i=2}^{\lfloor \frac{n}{d}\rfloor}g(i)\\ =&H(n)-\sum_{i=2}^ng(i)\sum_{d=1}^{\lfloor\frac{n}{i}\rfloor}f(i)\\ =&H(n)-\sum_{i=2}^ng(i)F(\lfloor\frac{n}{i}\rfloor) \end{aligned} \]
注意上面的推导过程中用大写字母表示了对应积性函数的前缀和

于是我们可以考虑用线筛处理一部分的\(f\)，然后再运用记忆化搜索和数论分块求解最后的答案，经证明，当\(N=n^\frac{2}{3}\)时时间最优，为\(O(n^{\frac{2}{3}})\)

例：求\(\mu\)，\(\varphi\)的前缀和，\(n\leq 10^9\)

考虑杜教筛，\(\mu*I=\epsilon\),\(\varphi*I=id_1\)，套用上面的推导过程即可

因为懒得手写hash于是就用了unordered_map

#include<iostream>
#include<string.h>
#include<string>
#include<stdio.h>
#include<algorithm>
#include<math.h>
#include<vector>
#include<queue>
#include<map>
#include<unordered_map>
using namespace std;
const int maxd=1000000007,N=5000000;
const double pi=acos(-1.0);
typedef long long ll;
int n,mu[5005000],pri[1001000],cnt=0;
ll phi[5005000];
bool ispri[5005000];
unordered_map<int,int> ansmu;
unordered_map<int,ll> ansphi;

int read()
{
    int x=0,f=1;char ch=getchar();
    while ((ch<'0') || (ch>'9')) {if (ch=='-') f=-1;ch=getchar();}
    while ((ch>='0') && (ch<='9')) {x=x*10+(ch-'0');ch=getchar();}
    return x*f;
}

void init()
{
    mu[1]=1;phi[1]=1;
    int i,j;
    for (i=2;i<=N;i++)
    {
        if (!ispri[i]) {pri[++cnt]=i;mu[i]=-1;phi[i]=i-1;}
        for (j=1;j<=cnt && i*pri[j]<=N;j++)
        {
            ispri[i*pri[j]]=1;
            if (i%pri[j]==0) {phi[i*pri[j]]=phi[i]*pri[j];break;}
            else {mu[i*pri[j]]-=mu[i];phi[i*pri[j]]=phi[pri[j]]*phi[i];}
        }
    }
    for (i=1;i<=N;i++) {phi[i]+=phi[i-1];mu[i]+=mu[i-1];}
}

int get_mu(int n)
{
    if (n<=N) return mu[n];
    if (ansmu[n]) return ansmu[n];
    int ans=1;
    unsigned int l,r;
    for (l=2;l<=n;l=r+1)
    {
        r=n/(n/l);
        ans-=(r-l+1)*get_mu(n/l);
    }
    ansmu[n]=ans;
    return ans;
}

ll get_phi(int n)
{
    if (n<=N) return phi[n];
    if (ansphi[n]) return ansphi[n];
    ll ans=((1ll+n)*n)/2ll;
    unsigned int l,r;
    for (l=2;l<=n;l=r+1)
    {
        r=n/(n/l);
        ans-=1ll*(r-l+1)*get_phi(n/l);
    }
    ansphi[n]=ans;
    return ans;
}

void work()
{
    int i,T=read();
    while (T--)
    {
        int n=read();
        ll ans1=get_phi(n);
        int ans2=get_mu(n);
        printf("%lld %d\n",ans1,ans2);
    }
}

int main()
{
    init();
    work();
    return 0;
}

\(min25\)筛

杜教筛求积性函数的前缀和已经能做到优秀的\(O(n^{\frac{2}{3}})\)了，但是还是有一个很大的缺陷：我们必须找到两个便于求前缀和的积性函数\(g,h\)使得它们与所求的积性函数\(f\)有\(f*g=h\)的关系，这在一些常规的积性函数中比较常见，但是在某些毒瘤出题人所给出的式子中却无法找到（有的函数甚至都不会给你完整的定义式），看起来这个时候我们就不得不回到最开始的线筛了，有没有更优秀的做法呢？

\(min25\)提出了一种积性函数筛法可以在\(O(\frac{n^{0.75}}{log\ n})\)的时间内求出积性函数的前缀和（但是我并不会证这个复杂度，另一种广为流传的时间复杂度为\(O(n^{1-\epsilon})\)

\(min25\)主要有以下两个步骤
（1）对\(\forall\ x=\lfloor\frac{n}{i}\rfloor\)，求\(\sum_{i=1}^x[i\in P]i^k\)，其中大写\(P\)表示素数集合，\(k\)是一个常数，其取值往往会根据题中所给函数的形式（主要是\(f(p^k)\)）而确定，有时候\(k\)的取值会多于一个

我们记\(g(n,j)=\sum_{i=1}^n[i\in P\ or\ min(i)\geq p_j]i^k\)，其中\(min(i)\)表示\(i\)的最小质因子，\(p_j\)表示第\(j\)个素数，很明显我们在这一步最终要求的是\(\forall\ x=\lfloor\frac{n}{i}\rfloor,g(x,|P|)\)的值

如何求\(g\)的值呢？我们考虑一下它的实际意义，让我们回到一个古老的筛素数方法——埃氏筛法，它考虑的是选取当前还未被筛掉的最小的数，认定它是一个质数，并用它筛掉剩余数中是该质数的倍数的数。我们发现\(g(n,j)\)就是在用\(j\)个素数进行了埃筛之后留下的数的\(f\)值

根据当前\(j\)的值进行分类讨论

i) 若\(p_j\leq \sqrt{n}\)，那么我们在这一次中会筛掉最小质因子恰好是\(p_j\)的数，也就是在除掉一个\(p_j\)后剩下的数的最小质因子必然大于等于\(p_j\)，也就是\(g(\lfloor\frac{n}{p_j}\rfloor,j-1)-\sum_{i=1}^{j-1}f(p_i)\)

ii)若\(p_j>\sqrt{n}\)，那么这一次筛掉的数至少为\(p_j^2\)，而这是一个大于\(n\)的数，所以这一次筛不会改变留下来的数，即为\(g(n,j-1)\)

综上所述，有
\[g(n,j)= \begin{cases} g(n,j-1) & p_j>\sqrt{n}\\ g(n,j-1)-f(p_j)[g(\lfloor\frac{n}{p_j}\rfloor,j-1)-\sum_{i=1}^{j-1}f(p_i)]& p_j\leq \sqrt{n} \end{cases} \]
所以我们可以直接筛出\(\sqrt{n}\)以内的素数，然后递推得到\(g(n,|P|)\)即可

（2）求\(S(n,j)=\sum_{i=1}^n[min(i)\geq p_j]f(i)\)
那么很明显\(\sum_{i=1}^nf(i)=S(n,1)+f(1)\)
求\(S(n,j)\)的话考虑两部分，一部分是质数的时候，直接减去\(<p_j\)的质数即可，这一部分是\(g(n,j)-\sum_{i=1}^{j-1}f(p_i)\)

接下来考虑合数，注意到满足条件的数一定可以写成\(p_k^e*x\)的形式（其中\(min(x)\geq p_k\)），于是我们可以枚举\(k\)和\(e\)，分开计算\(x\)中是否还有\(p_k\)即可
写在一起就是
\[ S(n,j)=g(n,j)-\sum_{i=1}^{j-1}f(p_i)+\sum_{k=j}^{p_k^2\leq n}\sum_{e=1}^{p^{e+1}\leq n}(S(\frac{n}{p_k^e},k+1)f(p_k^e)+f(p_k^{e+1})) \]

边界条件就是\(n\leq 0\)或者是\(p_j>n\)时\(S(n,j)=0\)

例题：DIVCNT2

据说可以大力杜教筛。。。感觉智商太低不大会

去spoj官网看一下的话发现这个题数据单位还是比较资瓷min25筛的，于是就写了一发min25

首先积性函数很容易就能证了，其次就有\(f(1)=1,f(p)=3,f(p^k)=2k+1\),由于此处\(f(p)\)与\(f(p^k)\)均与\(p\)无关，于是我们直接求\(\sum_{i=1}^{\lfloor\frac{n}{j}\rfloor}[i\in P]\)即可

献上常数巨大的代码

#pragma GCC optimize(2)
#include<iostream>
#include<string.h>
#include<string>
#include<stdio.h>
#include<algorithm>
#include<vector>
#include<math.h>
#include<queue>
#include<set>
#include<map>
using namespace std;
typedef long long ll;
typedef long double db;
typedef unsigned long long ull;
const int N=2000000;
const db pi=acos(-1.0);
#define lowbit(x) (x)&(-x)
#define sqr(x) (x)*(x)
#define rep(i,a,b) for (register int i=a;i<=b;i++)
#define per(i,a,b) for (register int i=a;i>=b;i--)
#define fir first
#define sec second
#define mp(a,b) make_pair(a,b)
#define pb(a) push_back(a)
#define maxd 998244353
#define eps 1e-8
int m,ptot=0,id1[N+10],id2[N+10],tot=0,pri[N+10];
ll n,w[N+10];
bool nopri[N+10];
ull g[N+10];

ll read()
{
    ll x=0;int f=1;char ch=getchar();
    while ((ch<'0') || (ch>'9')) {if (ch=='-') f=-1;ch=getchar();}
    while ((ch>='0') && (ch<='9')) {x=x*10+(ch-'0');ch=getchar();}
    return x*f;
}

void sieve()
{
    rep(i,2,N)
    {
        if (!nopri[i]) pri[++ptot]=i;
        int j;
        for (j=1;j<=ptot && i*pri[j]<=N;j++)
        {
            nopri[i*pri[j]]=1;
            if (i%pri[j]==0) break;
        }
    }
}

void calc(ll n)
{
    m=sqrt(n);tot=0;
    ll l,r;
    for (l=1;l<=n;l=r+1)
    {
        r=n/(n/l);w[++tot]=(n/l);
        if (w[tot]<=m) id1[w[tot]]=tot;else id2[n/w[tot]]=tot;
        g[tot]=w[tot]-1;
    }
    int i,j;
    for (i=1;i<=ptot && 1ll*pri[i]*pri[i]<=n;i++)
    {
        for (j=1;j<=tot && 1ll*pri[i]*pri[i]<=w[j];j++)
        {
            int k;
            if (w[j]/pri[i]<=m) k=id1[w[j]/pri[i]];else k=id2[n/(w[j]/pri[i])];
            g[j]=g[j]-g[k]+(i-1);
        }
    }
}

ull s(ll lim,int cnt)
{
    if ((lim<=1) || (pri[cnt]>lim)) return 0;
    ull ans=0;
    if (lim<=m) ans=3ull*(g[id1[lim]]-(cnt-1));else ans=3ull*(g[id2[n/lim]]-(cnt-1));
    int i,j;
    for (i=cnt;i<=ptot&&1ll*pri[i]*pri[i]<=lim;i++)
    {
        ll pro=pri[i];
        for (j=1;pro*pri[i]<=lim;j++,pro=pro*pri[i])
        {
            ans+=s(lim/pro,i+1)*(j*2+1)+j*2+3;
        }
    }
    return ans;
}

signed main()
{
    sieve();
    int T=read();
    while (T--)
    {
        n=read();
        calc(n);
        printf("%llu\n",s(n,1)+1);
    }
    return 0;
}

定义及前置芝士

线性筛求积性函数

杜教筛

\(min25\)筛

猜你喜欢