题目
发现题目就是求循环某位数后是回文串的长度为n的串的数量。
考虑长度为n的串,最小循环节出现了
次,串被分为了
块。
那么循环
次后又会得到一个回文串。
有没有可能比
更小呢?
发现这个等价于求无循环节(循环节为字符串长度)的回文串循环多少次后还是回文串。
发现循环u次后,串会变成一个长度为
的回文串+一个长度为
的回文串。
然后(假设)这整个串回文,所以可以得到
个长度为
的回文串和一个长度为
的回文串满足:
,然后这两个和之前
与
的情况类似,所以可以一直递归下去。如果
了,那么这个串就有长度为
的循环节,矛盾。
但是等等,如果
,即
,这时就没有循环节了,但是需要满足串长为偶数。
所以要么最少循环
次,要么循环
次(
),就会又得到一个回文串。
我们把每个回文串最少循环几次会得到回文串作为一个回文串的价值,那么所有回文串的价值之和刚好就不重不漏的计算了符合条件的串的个数。
枚举最小循环节长度
好像是不好求的
由于
所以可以莫比乌斯反演
带入得到:
把不好惹的放外面:
好像也不好惹
考虑把
的
和
其中一个提出来。
考虑到
是不好惹的,我们最好把他扔出来,
尝试
为奇数时成立,
为偶数且
为偶数时也成立,
为偶数且
为奇数时好像不成立。
因为:
为奇数时且
为偶数时,
为偶数。
所以贡献为0,不用管。
所以答案
然后
可以发现
然后可以把
给
一下,算一下最多只有
个约数,
然后就可以算了。
然后你(可能)会发现你T了,下组数据一测发现Pollard-Rho的时间耗费是0ms( 的毒瘤卡常Pollard-Rho了解一下,350组数据跑1s),计算答案时的 的快速幂成了最耗时的部分,原因?在快速幂中用了 才需要的快速乘。模数为 就直接转LL模就行了,快了(至少)4倍(也可以理解为快速乘有4倍以上的常数)。
AC Code:
#include<bits/stdc++.h>
#define LL long long
using namespace std;
LL n,k,mod;
#define il inline
il LL mul(LL a,LL b,LL p = mod){
a=(a%p+p)%p,b=(b%p+p)%p;
return (((a*b)-(LL)((long double)a*b/p)*p)%p+p)%p; }
il LL Pow(LL base,LL k,LL p = mod){
LL ret=1;
for(;k;k>>=1,base=mul(base,base,p))
if(k&1)
ret=mul(ret,base,p);
return ret;
}
il int ksm(int base,LL k){
int ret = 1;
for(;k;k>>=1,base=1ll*base*base%mod)
if(k&1)
ret=1ll*ret*base%mod;
return ret;
}
il LL gcd(LL a,LL b){ return !b ? a : gcd(b,a%b); }
namespace Pollard_Rho{
int base[5]={2,3,7,31,61};
bool Miller_Rabin(LL x){
for(int i=0;i<5;i++) if(x == base[i]) return 1;
LL res = x-1 , k = 0;
for(;!(res&1);res>>=1,k++);
for(int i=0;i<5;i++){
LL pre = Pow(base[i],res,x) , now;
for(int t=k;t--;swap(now,pre))
if((now=mul(pre,pre,x))==1 && pre!=1 && pre!=x-1)
return 0;
if(pre!=1) return 0;
}
return 1;
}
LL Rho(LL x,LL c){
LL i=1,j=0,sum=1,a=rand() % (x-1) + 1,b=a,d=1;
for(;d==1;){
sum = mul(sum , abs((a = (mul(a,a,x) + c) % x) - b) , x);
if(++ j == i) i<<=1,b=a,d = gcd(sum , x);
if(!(j&1023)) d = gcd(sum , x);
}
return d == x ? Rho(x,c+1) : d;
}
map<LL,int>mp;
void Pollard(LL x){
if(x == 1) return;
if(Miller_Rabin(x)){
mp[x]++;
return;
}
LL tmp = Rho(x,3);
Pollard(tmp) , Pollard(x/tmp);
}
vector<pair<LL,int> >Solve(LL x){
mp.clear(),Pollard(x);
vector<pair<LL,int> > ret;
for(auto u:mp) ret.push_back(u);
return ret;
}
}
vector<pair<LL,int> >ar;
LL ans = 0;
void dfs(int now,LL num,int sum){
if(now == ar.size()){
LL p = n/num;
if((p&1) && !(num&1)) return;
ans = (ans + ((p&1)?p%mod:p/2%mod) * ksm(k % mod,(p+1)/2) % mod * sum) % mod;
return;
}
LL sn = 1;
for(int i=0;i<=ar[now].second;i++,sn*=ar[now].first)
if(i) dfs(now+1,num*sn,sum * 1ll * (mod+1-ar[now].first%mod) % mod);
else dfs(now+1,num*sn,sum);
}
int main(){
int T;
for(scanf("%d",&T);T--;){
scanf("%lld%lld%lld",&n,&k,&mod);
ar = Pollard_Rho::Solve(n);
ans = 0;
dfs(0,1,1);
printf("%lld\n",ans);
}
}