专栏文章

蜜月日记 Part9

休闲·娱乐参与者 1已保存评论 0

文章操作

快速查看文章及其快照的属性,并进行相关操作。

当前评论
0 条
当前快照
1 份
快照标识符
@miqinjzi
此快照首次捕获于
2025/12/04 05:25
3 个月前
此快照最后确认于
2025/12/04 05:25
3 个月前
查看原文

前言

争取写到 Day 100.

Day 81

数论已经好久没有在蜜月日记里出现了。

题意

定义 f(x)f(x)xx 的质因数分解后各个质因子的次数和,求 i=1n(1)f(i)\sum\limits_{i=1}^n (-1)^{f(i)}

思路

显然 f(x)f(x) 是完全和性函数,故 (1)f(x)(-1)^{f(x)} 是(完全)积性函数。下面设 F(x)=(1)f(x)F(x)=(-1)^{f(x)}
可以直接 min_25,但是我不会。又懒得去推这个函数如何杜教筛。
所以考虑一些科技飞升做法,比如 PN 筛。下面会给出 PN 筛的流程,但不会有定义和证明。
首先寻找质数 pp 处取值相同的积性函数 GG。我们有 (1)f(p)=1=μ(p)(-1)^{f(p)}=-1=\mu(p),所以取 G(x)=μ(x)G(x)=\mu(x)。如无特殊说明,下面 pp 均为质数。
然后设积性函数 H(x)H(x) 满足 F=GHF=G*H,这里 * 是狄利克雷卷积,则 HH 只在 PN 处不为 00
则我们有 F(pk)=i=0kμ(pi)H(pki)F(p^k)=\sum\limits_{i=0}^k \mu(p^i)H(p^{k-i})。简单化简得到 (1)k=H(pk)H(pk1)(-1)^k=H(p^k)-H(p^{k-1})。结合 H(p)=0H(p)=0,有 H(pk)=[2k]H(p^k)=[2|k]
我们有 i=1nF(i)=i=1ndiH(d)μ(id)\sum\limits_{i=1}^n F(i)=\sum\limits_{i=1}^n\sum\limits_{d|i}H(d)\mu(\dfrac{i}{d})
枚举因数变枚举倍数得到 i=1nF(i)=d=1ni=1ndμ(i)H(d)\sum\limits_{i=1}^n F(i)=\sum\limits_{d=1}^n\sum\limits_{i=1}^{\lfloor\frac{n}{d}\rfloor}\mu(i)H(d)
S(x)=i=1xμ(i)S(x)=\sum\limits_{i=1}^x\mu(i),化简得到 i=1nF(i)=d=1nH(d)S(nd)\sum\limits_{i=1}^n F(i)=\sum\limits_{d=1}^n H(d)S(\lfloor\dfrac{n}{d}\rfloor)
枚举令 H(d)0H(d)\neq 0O(n)O(\sqrt n) 个 PN,用一次杜教筛算出 O(n)O(\sqrt n) 个本质不同的 S(nd)S(\lfloor\dfrac{n}{d}\rfloor) 即可。
瓶颈在于一次杜教筛,时间复杂度 O(n23)O(n^{\frac 2 3})

代码

CPP
#include<bits/stdc++.h>
#include<ext/pb_ds/assoc_container.hpp>
#include<ext/pb_ds/hash_policy.hpp>
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
#define ll long long
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
using namespace std;
const int MAXN=5e7+1,LIM=1e6+1;
bool vis[MAXN];
ll mu[MAXN];
int pr[3001135],cnt;
inline void init(){
	mu[1]=1;
	F(i,2,MAXN-1){
		if(!vis[i]) pr[++cnt]=i,mu[i]=-1;
		F(j,1,cnt){
			ll k=i*pr[j];
			if(k>=MAXN) break;
			vis[k]=1;
			if(i%pr[j]) mu[k]=-mu[i];
			else break;
		}
	}
	F(i,2,MAXN-1) mu[i]+=mu[i-1];
	return;
}
__gnu_pbds::gp_hash_table<ll,int>res;
ll n,ans;
ll S(ll x){
	if(x<MAXN&&x!=n) return mu[x];
	if(res.find(x)!=res.end()) return res[x];
	ll ans=1;
	for(ll l=2,r;l<=x;l=r+1){
		ll qwq=x/l;
		r=x/qwq;
		ans=ans-(r-l+1)*S(qwq);
	}
	return res[x]=ans;
}
void dfs(int step,ll now,ll H){
	ll pri=pr[step],nxt=pri*pri;
	if(step>cnt||now>n/nxt){
		ans+=H*S(n/now);
		return;
	}
	dfs(step+1,now,H);
	for(int expo(2);now*nxt<=n;++expo,nxt*=pri) dfs(step+1,now*nxt,H*((expo&1)==0));
	return;
}
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	cin>>n;
	init(),S(n);
	dfs(1,1,1);
	cout<<ans;
	return 0;
}

Day 82

快要去 WC 了,浅卷一卷。

题意

定义数列 F0=a,F1=b,Fn=(Fn1+Fn2)modmF_0=a,F_1=b,F_n=(F_{n-1}+F_{n-2})\bmod mNN 次询问 a,ba,b 求满足 Fp=0F_p=0 的最小非负整数 pp

思路

注意区分下文的 N,nN,n
设斐波那契数列为 {fn}\{f_n\},则 Fn=afn1+bfnF_n=af_{n-1}+bf_n。相当于要求最小的 nn 满足 afn1+bfn0(modm)af_{n-1}+bf_n\equiv 0\pmod m
关于模意义下的斐波那契数列,有经典结论:
【皮萨诺周期】mm 意义下斐波那契数列有长度 6m\le 6m 的最小正周期,称为皮萨诺周期。具体地,有如下几个结论计算:
  • gcd(a,b)=1\gcd(a,b)=1,则 abab 的皮萨诺周期是 a,ba,b 的皮萨诺周期的最小公倍数。
  • 2,52,5 的皮萨诺周期分别是 3,203,20
  • 对于奇质数 p1,4(mod5)p\equiv 1,4\pmod 5,皮萨诺周期为 p1p-1
  • 对于奇质数 p2,3(mod5)p\equiv 2,3\pmod 5,皮萨诺周期为 2p+22p+2
  • pp 为质数,则 pkp^k 的皮萨诺周期为 pp 的皮萨诺周期乘 pk1p^{k-1}
本题中只需要用到皮萨诺周期是 O(m)O(m) 的这个结论。
先特判 a=0a=0b=0b=0,下面认为 a,ba,b 全不为 00
bmbb\leftarrow m-b,则要求最小的 nn 满足 afn1bfn(modm)af_{n-1}\equiv bf_n\pmod m
a=agcd(a,b,m),b=bgcd(a,b,m),m=mgcd(a,b,m)a'=\dfrac{a}{\gcd(a,b,m)},b'=\dfrac{b}{\gcd(a,b,m)},m'=\dfrac{m}{\gcd(a,b,m)},根据同余的基本性质,所求式变为 afn1bfn(modm)a'f_{n-1}\equiv b'f_n\pmod{m'}。注意这里 a,b,ma',b',m' 并不是两两互质,不一定存在逆元。
根据另一个经典结论,gcd(fn,fn1)=fgcd(n,n1)=1\gcd(f_n,f_{n-1})=f_{\gcd(n,n-1)}=1,因此有 gcd(fn1,m)=gcd(b,m)=r,gcd(fn,m)=gcd(a,m)=s\gcd(f_{n-1},m')=\gcd(b',m')=r,\gcd(f_n,m')=\gcd(a',m')=s
再设 a=ar,b=bs,m=mrsa''=\dfrac{a'}{r},b''=\dfrac{b'}{s},m''=\dfrac{m'}{rs},则 afn1bfn(modm)a''f_{n-1}\equiv b''f_n\pmod{m''}。此时它们两两互质,故可以求逆元。对于每个 mmm'|m 预处理三元组 (r,s,fnfn1modmrs)(r,s,\dfrac{f_{n}}{f_{n-1}}\bmod{\dfrac{m'}{rs}}),用哈希表存一下就行。
懒了,用的 map,时间复杂度 O(σ(m)logm+Nlog(σ(m)))O(\sigma(m)\log m+N\log(\sigma(m))),其中 σ\sigma 是约数和函数。

代码

CPP
#include<bits/stdc++.h>
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
#define ll long long
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
using namespace std;
const int MAXN=1e5+1;
void exgcd(int a,int b,int&x,int&y){
	if(b==0) return x=1,y=0,void();
	else return exgcd(b,a%b,y,x),y-=a/b*x,void();
}
ll inv(int x,int MOD){
	int inv,y;
	exgcd(x,MOD,inv,y);
	return (inv%MOD+MOD)%MOD;
}
int N,m;
struct Triple{
	int r,s,val;
	bool operator<(const Triple&x)const{
		return r==x.r?(s==x.s?val<x.val:s<x.s):r<x.r;
	}
};
map<Triple,int>ans[MAXN];
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	cin>>N>>m;
	F(mm,2,m) if(m%mm==0){
		int fn1=0,fn=1;
		for(int n=1;;++n){
			int r=__gcd(fn1,mm),s=__gcd(fn,mm),MOD=mm/r/s;
			Triple qwq={r,s,fn/s*inv(fn1/r,MOD)%MOD};
			if(ans[mm].find(qwq)==ans[mm].end()) ans[mm][qwq]=n;
			int nxt=fn+fn1;
			nxt>=mm&&(nxt-=mm);
			fn1=fn,fn=nxt;
			if(fn1==0&&fn==1) break;
		}
	}
	for(;N;--N){
		int a,b,mm,d;
		cin>>a>>b,b=(m-b)%m;
		if(a==0){
			cout<<"0\n";
			continue;
		}
		if(b==0){
			cout<<"1\n";
			continue;
		}
		d=__gcd(__gcd(a,b),m);
		a/=d,b/=d,mm=m/d;
		int r=__gcd(a,mm),s=__gcd(b,mm),MOD=mm/r/s;
		a=a/r,b=b/s;
		auto it=ans[mm].find((Triple){s,r,a*inv(b,MOD)%MOD});
		if(it==ans[mm].end()) cout<<"-1\n";
		else cout<<it->second<<"\n";
	}
	return 0;
}

Day 83

WC 讲课的题,老早就会了,一直没写。

题意

定义 1,2,3\otimes_1, \otimes_2, \otimes_3 分别为按位与、按位或、按位异或运算。给定长为 o1,o2,,owo_1,o_2,\cdots,o_w,定义位运算 xy=zx \oplus y=z 表示二进制下 zz 的从低到高第 ii 位等于 x,yx,y 的从低到高第 ii 位进行 oi\otimes_{o_i} 运算。给定一个 nn 个点 mm 条边的无向图,边权 [0,2w)Z\in[0,2^w)\cap\mathbb Z,求运算 \oplus 意义下的最大生成树。

思路

数据范围超级小,那就应该不是传统最优化。
这个运算没有什么性质,但是众所周知的是我们可以用生成函数求边权和为某个数的生成树个数,这里同样可以。
设一条边权为 vv 的边的生成函数为 xvx^v,多项式乘法定义为 \oplus 卷积,加法就是普通多项式加法,然后就可以跑矩阵树定理了。
又因为 FWT 是线性变换,可以在求行列式之前对矩阵中每个元素求 FWT,再对每一位求行列式,最后 IFWT 回来。
这里 \oplus 的 FWT 可以视为对每一维做不同变换,即对按位与的位做长度为 22min\min 卷积的变换(后缀和),按位或的为做长度为 22max\max 卷积的变换(前缀和),按位异或做长度为 22 的加法卷积的变换(FFT)。
方案数可以对大质数取模。
时间复杂度 O(n32w)O(n^3 2^w)

代码

CPP
#include<bits/stdc++.h>
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
#define ll long long
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
using namespace std;
const int MAXN=71,MAXL=4096,MOD=1e9+9,INV2=(MOD+1)/2;
inline ll qpow(ll base,int expo){
	ll res(1);
	while(expo){
		(expo&1)&&(res=res*base%MOD);
		base=base*base%MOD,expo>>=1;
	}
	return res;
}
int n,m,w,l;
char o[MAXN];
ll kir[MAXN][MAXN][MAXL];
inline void FWT(ll*poly,bool inv){
	for(int len=2,i=0;len<=l;len<<=1,++i){
		int qwq=len>>1;
		switch(o[i]){
			case '&':{
				for(int i(0);i<l;i+=len) F(j,i,i+qwq-1){
					if(inv) (poly[j]-=poly[j+qwq])<0&&(poly[j]+=MOD);
					else (poly[j]+=poly[j+qwq])>=MOD&&(poly[j]-=MOD);
				}
				break;
			}
			case '|':{
				for(int i(0);i<l;i+=len) F(j,i,i+qwq-1){
					if(inv) (poly[j+qwq]-=poly[j])<0&&(poly[j+qwq]+=MOD);
					else (poly[j+qwq]+=poly[j])>=MOD&&(poly[j+qwq]-=MOD);
				}
				break;
			}
			case '^':{
				for(int i(0);i<l;i+=len) F(j,i,i+qwq-1){
					int x=poly[j],y=poly[j+qwq];
					(poly[j]=x+y)>=MOD&&(poly[j]-=MOD);
					(poly[j+qwq]=x-y)<0&&(poly[j+qwq]+=MOD);
					if(inv) poly[j]=poly[j]*INV2%MOD,poly[j+qwq]=poly[j+qwq]*INV2%MOD;
				}
				break;
			}
		}
	}
	return;
}
ll mat[MAXN][MAXN],ans[MAXL];
inline ll det(){
	bool neg=0;
	F(i,1,n-1){
		if(!mat[i][i]){
			bool flag=1;
			F(j,i+1,n-1) if(mat[j][i]){
				flag=0;
				swap(mat[j],mat[i]);
				neg^=1;
				break;
			}
			if(flag) return 0;
		}
		ll inv=qpow(mat[i][i],MOD-2);
		F(j,i+1,n-1){
			ll factor=inv*mat[j][i]%MOD;
			F(k,i,n-1) (mat[j][k]=mat[j][k]-factor*mat[i][k]%MOD)<0&&(mat[j][k]+=MOD);
		}
	}
	ll res=(neg?MOD-1:1);
	F(i,1,n-1) res=res*mat[i][i]%MOD;
	return res;
}
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	cin>>n>>m>>o;
	w=strlen(o),l=1<<w;
	F(i,1,m){
		int x,y,v;
		cin>>x>>y>>v;
		--kir[x][y][v],--kir[y][x][v];
		++kir[x][x][v],++kir[y][y][v];
	}
	F(x,1,n-1) F(y,1,n-1){
		F(v,0,l-1) kir[x][y][v]<0&&(kir[x][y][v]+=MOD);
		FWT(kir[x][y],0);
	}
	F(i,0,l-1){
		F(x,1,n-1) F(y,1,n-1) mat[x][y]=kir[x][y][i];
		ans[i]=det();
	}
	FWT(ans,1);
	R(i,l-1,0) if(ans[i]) return cout<<i,0;
	cout<<"-1";
	return 0;
}

Day 84

考 WC 前紧急打一打多项式板子。

题意

求长为 nn 的前缀最大值个数减后缀最大值个数为 kk 的排列个数模 998244353998244353

思路

把排列从最大值处分开,右侧没有前缀最大值,左侧没有后缀最大值。
设前后缀缀最大值分别有 x,yx,y 个。先考虑最大值左边,发现可以当成是把左边的元素分成了 x1x-1 个排列,强制要求最大值在第一个。这又相当于把左边的元素分成了 x1x-1 个轮换。
右边同理,是 y1y-1 个轮换。方案数就是把 n1n-1 个元素分成 x+y2x+y-2 个轮换,选出 x1x-1 个分配到左边的方案数。前半部分是第一类斯特林数,后半部分是组合数。即此时的方案数为 s(n1,x+y2)(x+y2x1)s(n-1,x+y-2)\dbinom{x+y-2}{x-1}。枚举 yy,有 x=y+kx=y+k 即可计算答案。
问题变成求一行第一类斯特林数。众所周知,第 nn 行第一类斯特林数的生成函数是 xnˉ=x(x+1)(x+n1)x^{\bar n}=x(x+1)\cdots(x+n-1),可以用倍增做到 O(nlogn)O(n\log n)。不过我这里是打板子,写的分治 NTT,时间复杂度 O(nlog2n)O(n\log^2 n)

代码

CPP
#include<bits/stdc++.h>
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
#define ll long long
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
#define vi vector<int>
using namespace std;
const int MAXN=(1<<19)+5,MOD=998244353,G=3;
inline ll qpow(ll base,int expo){
	ll res(1);
	while(expo){
		(expo&1)&&(res=res*base%MOD);
		base=base*base%MOD,expo>>=1;
	}
	return res;
}
const int INVG=qpow(G,MOD-2);
ll powg[2][20][MAXN];
inline void init(){
	F(i,0,1) F(j,1,19){
		powg[i][j][0]=1;
		ll qwq=qpow(i?INVG:G,(MOD-1)>>j);
		F(k,1,MAXN-1) powg[i][j][k]=powg[i][j][k-1]*qwq%MOD;
	}
	return;
}
int rev[MAXN];
inline void NTT(int*poly,int len,bool inv){
	F(i,0,len-1) if(i<rev[i]) swap(poly[i],poly[rev[i]]);
	for(int i=1,expo=1;i<len;i<<=1,++expo) for(int j=0;j<len;j+=(i<<1)) F(k,0,i-1){
		int&x(poly[j|k]),&y(poly[i|j|k]);
		ll qwq=y*powg[inv][expo][k]%MOD;
		(y=x-qwq)<0&&(y+=MOD);
		(x+=qwq)>=MOD&&(x-=MOD);
	}
	if(inv){
		ll invl=qpow(len,MOD-2);
		F(i,0,len-1) poly[i]=poly[i]*invl%MOD;
	} 
	return;
}
int px[MAXN],py[MAXN];
inline vi mul(const vi&x,const vi&y){
	int n=x.size()+y.size()-1,l=1;
	while(l<n) l<<=1;
	F(i,0,l-1) rev[i]=(rev[i>>1]>>1)|((i&1)?(l>>1):0);
	F(i,0,x.size()-1) px[i]=x[i];
	F(i,x.size(),l-1) px[i]=0;
	F(i,0,y.size()-1) py[i]=y[i];
	F(i,y.size(),l-1) py[i]=0;
	NTT(px,l,0),NTT(py,l,0);
	F(i,0,l-1) px[i]=px[i]*1ll*py[i]%MOD;
	NTT(px,l,1);
	vi res(n);
	F(i,0,n-1) res[i]=px[i];
	return res;
}
vi solve(int l,int r){
	if(l>r) return vi({1});
	if(l==r) return vi({l,1});
	int mid=(l+r)>>1;
	return mul(solve(l,mid),solve(mid+1,r));
}
int n,k;
vi s;
ll fact[MAXN],inv[MAXN];
inline ll C(int x,int y){
	return x>=y&&y>=0?fact[x]*inv[y]%MOD*inv[x-y]%MOD:0;
}
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	init();
	cin>>n>>k;
	s=solve(0,n-2);
	fact[0]=1;
	F(i,1,n) fact[i]=fact[i-1]*i%MOD;
	inv[n]=qpow(fact[n],MOD-2);
	R(i,n,1) inv[i-1]=inv[i]*i%MOD;
	ll ans=0;
	F(y,1,n){
		int x=y+k;
		if(x<=0) continue;
		if(x+y-2>n-1) break;
		ans=(ans+s[x+y-2]*C(x+y-2,x-1))%MOD;
	}
	cout<<ans;
	return 0;
}

Day 85

被 WC T2 位运算创飞了。感觉自己不会位运算相关 trick,尤其是既有异或又有加法的。

题意

给定 n+qn+qmm 位二进制数 a1,a2,,an,r1,r2,,rqa_1,a_2,\cdots,a_n,r_1,r_2,\cdots,r_q,对每个 t=1,2,,qt=1,2,\cdots,q,求出运算符序列 1,,n\otimes_1,\cdots,\otimes_n 的个数,满足 i\otimes_i 为按位且和按位或之一,且 01a12nan=rt0\otimes_1 a_1\otimes_2\cdots\otimes_n a_n=r_t。答案对 109+710^9+7 取模。

思路

首先这个肯定是按位考虑。下面暂时认为 m=1m=1
先研究 n\otimes_n 应该怎么取。如果是按位且 11,没有任何效果,就要以相同方式研究 n1\otimes_{n-1};如果是按位且 00,无论前面如何,结果都是 00。按位或是类似的。
发现这个过程很像字典序比较。把按位或当成 00,按位且当成 11,以第 nn 位为最高位,得到的二进制数设为 xx。把 ana_n 当成最高位所有 aia_i 组成的二进制数设为 yy。则有 x<yx<y\Leftrightarrow 结果是 11
然后是 m1m\neq 1 的情况,把每一位对应的不等式交起来就好了。
时间复杂度 O(nmlogn+nq)O(nm\log n+nq)

代码

CPP
#include<bits/stdc++.h>
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
#define ll long long
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
#define fi first
#define se second
using namespace std;
const int MAXN=5002,MOD=1e9+7;
int n,m,q,val[MAXN];
pair<string,int>id[MAXN];
char ch[MAXN][MAXN],ask[MAXN];
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	cin>>n>>m>>q;
	F(i,1,n) cin>>(ch[i]+1);
	F(i,1,m){
		R(j,n,1) id[i].fi+=ch[j][i],val[i]=((val[i]<<1)|(ch[j][i]^'0'))%MOD;
		id[i].se=i;
	}
	sort(id+1,id+m+1);
	F(i,1,n) id[0].fi+='0',id[m+1].fi+='1',val[m+1]=((val[m+1]<<1)|1)%MOD;
	id[0].se=0,id[m+1].se=m+1,val[0]=0,++val[m+1];
	for(;q;--q){
		cin>>(ask+1);
		int l=m+1,r=0;
		F(i,1,m){
			if(ask[id[i].se]=='0') r=max(i,r);
			else l=min(i,l); 
		}
		if(l<r) cout<<"0\n";
		else cout<<(val[id[l].se]-val[id[r].se]+MOD)%MOD<<"\n";
	}
	return 0;
}

Day 86

寒假摆会烂,写点典题。

题意

nn 个点无标号无根树的数量。

思路

首先求出 nn 个点无标号有根树的数量 fnf_n,再钦定重心为根。
fnf_n 的 OGF 为 F(x)F(x)。由于把根删掉之后是无标号有根树森林,即对无标号有根树进行 MSET\operatorname{MSET} 构造。
在无标号体系下的 MSET\operatorname{MSET} 构造定义为:
【欧拉变换】 E(F(x))=i=11(1xi)[xi]F(x)=exp(i=1F(xi)i)\mathcal E(F(x))=\prod\limits_{i=1}^{\infty}\dfrac{1}{(1-x^i)^{[x^i]F(x)}}=\exp(\sum\limits_{i=1}^\infty\dfrac{F(x^i)}{i}),其中 E\mathcal E 被称为欧拉变换或 Pólya exp,即无标号体系下的 MSET\operatorname{MSET} 构造。
第一个等号的组合意义是背包,第二个等号是先求 ln\ln 再求 exp\exp
于是有生成函数方程:
F(x)=xE(F(x))F(x)=x\mathcal E(F(x))
下面就是要化简成好处理的方式了。先展开成 F(x)=xei=1F(xi)iF(x)=xe^{\sum\limits_{i=1}^{\infty}\frac{F(x^i)}{i}}
两边同时求导得到 F(x)=E(F(x))+x(ei=1F(xi)i)F'(x)=\mathcal E(F(x))+x\left(e^{\sum\limits_{i=1}^{\infty}\frac{F(x^i)}{i}}\right)'
使用链式求导法则,得到 F(x)=E(F(x))+xexp(i=1F(xi)i)i=1F(xi)xi1F'(x)=\mathcal E(F(x))+x\exp(\sum\limits_{i=1}^{\infty}\dfrac{F(x^i)}{i})\sum\limits_{i=1}^{\infty}F'(x^i)x^{i-1}
整理得到 F(x)=F(x)x+F(x)i=1F(xi)xi1F'(x)=\dfrac{F(x)}{x}+F(x)\sum\limits_{i=1}^{\infty}F'(x^i)x^{i-1}
两边同时乘 xxxF(x)=F(x)i=1F(xi)xixF'(x)=F(x)\sum\limits_{i=1}^{\infty}F'(x^i)x^i
G(x)=i=1F(xi)xi,gn=[xn]G(x)G(x)=\sum\limits_{i=1}^{\infty}F'(x^i)x^i,g_n=[x^n]G(x),不难推出 gn=dndfdg_n=\sum\limits_{d|n}df_d。则有 nfn=fn+i=1n1figninf_n=f_n+\sum\limits_{i=1}^{n-1}f_ig_{n-i}
整理得到:
fn=1n1i=1n1fignif_n=\dfrac{1}{n-1}\sum\limits_{i=1}^{n-1}f_ig_{n-i}
其中 f1=1f_1=1
这个式子就可以分治 FFT 了。注意 l=1l=1 时直接计算贡献有问题,需要特殊处理。
然后容斥掉根不是重心的方案数。
2n2\nmid n 时,只有一个重心,枚举大小 n2\ge \lfloor\dfrac n 2\rfloor 的子树大小,得到答案为 fni=n2n1fifnif_n-\sum\limits_{i=\lfloor\frac n 2\rfloor}^{n-1}f_if_{n-i}
否则,还要减去以两个重心为根不同构的情况 (fn22)\dbinom{f_{\frac n 2}}{2}
最后答案为:
fn(i=n2n1fifni)[2n](fn22)f_n-\left(\sum\limits_{i=\lfloor\frac n 2\rfloor}^{n-1}f_if_{n-i}\right)-[2|n]\dbinom{f_{\frac n 2}}{2}
瓶颈在于分治 FFT,时间复杂度 O(nlog2n)O(n\log^2 n)。其实可以牛顿迭代但是常数过大。

代码

CPP
#include<bits/stdc++.h>
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
#define ll long long
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
using namespace std;
const int MAXN=(1<<19)+5,MOD=998244353,G=3;
inline ll qpow(ll base,int expo){
	ll res(1);
	while(expo){
		(expo&1)&&(res=res*base%MOD);
		base=base*base%MOD,expo>>=1;
	}
	return res;
}
const int INVG=qpow(G,MOD-2);
ll powg[2][20][MAXN];
inline void init(){
	F(i,0,1) F(j,1,19){
		powg[i][j][0]=1;
		ll qwq=qpow(i?INVG:G,(MOD-1)>>j);
		F(k,1,MAXN-1) powg[i][j][k]=powg[i][j][k-1]*qwq%MOD;
	}
	return;
}
int rev[MAXN];
inline void NTT(int*poly,int len,bool inv){
	F(i,0,len-1) if(i<rev[i]) swap(poly[i],poly[rev[i]]);
	for(int i=1,expo=1;i<len;i<<=1,++expo) for(int j=0;j<len;j+=(i<<1)) F(k,0,i-1){
		int&x(poly[j|k]),&y(poly[i|j|k]);
		ll qwq=y*powg[inv][expo][k]%MOD;
		(y=x-qwq)<0&&(y+=MOD);
		(x+=qwq)>=MOD&&(x-=MOD);
	}
	if(inv){
		ll invl=qpow(len,MOD-2);
		F(i,0,len-1) poly[i]=poly[i]*invl%MOD;
	} 
	return;
}
inline int mul(int l,int*x,int*y,int*res){
	l=1<<(__lg(l)+1);
	F(i,0,l-1) rev[i]=(rev[i>>1]>>1)|((i&1)?(l>>1):0);
	static int px[MAXN],py[MAXN];
	memcpy(px,x,sizeof(int)*l);
	memcpy(py,y,sizeof(int)*l);
	NTT(px,l,0),NTT(py,l,0);
	F(i,0,l-1) res[i]=px[i]*1ll*py[i]%MOD,px[i]=py[i]=0;
	NTT(res,l,1);
	return l;
}
int n,f[MAXN],g[MAXN];
void DandQ_FFT(int l,int r){
	int mid=(l+r)>>1;
	if(l==r){
		if(l==1) f[l]=1;
		else f[l]=f[l]*qpow(l-1,MOD-2)%MOD;
		int qwq=f[l]*1ll*l%MOD;
		for(int i=l;i<=n;i+=l) (g[i]+=qwq)>=MOD&&(g[i]-=MOD);
		return;
	}
	DandQ_FFT(l,mid);
	if(l==1){
		static int p1[MAXN],p2[MAXN],res[MAXN];
		F(i,l,mid) p1[i-l]=f[i],p2[i-l]=g[i];
		int len=mul((mid-l)<<1,p1,p2,res);
		F(i,mid+1,r) (f[i]+=res[i-l-1])>=MOD&&(f[i]-=MOD);
		F(i,0,len) p1[i]=p2[i]=res[i]=0;
	}else{
		static int p1[MAXN],p2[MAXN],res[MAXN];
		F(i,l,mid) p1[i-l]=f[i];
		F(i,1,r-l) p2[i-1]=g[i];
		int len=mul(r+mid-l-l+1,p1,p2,res);
		F(i,mid+1,r) (f[i]+=res[i-l-1])>=MOD&&(f[i]-=MOD);
		F(i,0,len) p1[i]=p2[i]=res[i]=0;
		F(i,l,mid) p1[i-l]=g[i];
		F(i,1,r-l) p2[i-1]=f[i];
		len=mul(r-l+mid-l+1,p1,p2,res);
		F(i,mid+1,r) (f[i]+=res[i-l-1])>=MOD&&(f[i]-=MOD);
		F(i,0,len) p1[i]=p2[i]=res[i]=0;
	}
	DandQ_FFT(mid+1,r);
	return;
}
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	init();
	cin>>n;
	DandQ_FFT(1,n);
	ll ans=f[n];
	F(i,(n>>1)+1,n-1) ans=(ans-f[i]*1ll*f[n-i])%MOD;
	if(!(n&1)) ans=(ans-f[n>>1]*(f[n>>1]-1ll)/2)%MOD;
	ans<0&&(ans+=MOD);
	cout<<ans;
	return 0;
}

Day 87

很神秘的题目。

题意

给定一个长为 nn 的数列 d0,,dn1d_0,\cdots,d_{n-1},满足 d00,di[0,9]Nd_0\neq 0,d_i\in[0,9]\cap\mathbb N。求最小的 AA 满足存在首项为 AA 公差为 BB 的等差数列 a0,a1,a_0,a_1,\cdots 和正整数 xx 使得 i[0,n1],di=ai10x1\forall i\in[0,n-1],d_i=\lfloor\dfrac{a_i}{10^{x-1}}\rfloor,或报告无解。

思路

先从无解情况开始思考。发现 dd 的增量 di+1did_{i+1}-d_i 可以看做是对位加再加上进位的贡献。进位最多 +1+1,所以 di+1did_{i+1}-d_i 在模 1010 意义下只有两种取值,且相差 11。如果不满足这个条件,必然无解。
然后只有一种取值也是好处理的,此时这种取值必然是 00,取 A=di,B=0,x=1A=d_i,B=0,x=1 即可。
接下来我们假设 di+1did_{i+1}-d_i 有差为 11 的两种取值。
首先你会发现 A,B<10xA,B<10^x,因为超过的部分不会对 dd 造成影响。
我们设 li=ai10xl_i=\lfloor\dfrac{a_i}{10^x}\rfloor。根据上面的观察 l0l_0 最低位是 d0d_0 其他位是 00
然后你发现 di<di+1d_i<d_{i+1} 代表第 xx 位不进位,di>di+1d_i>d_{i+1} 代表第 xx 位进位,相等的情况可以用另一种 di+1did_{i+1}-d_i 的取值是 11 还是 99 来判断 是否进位,11 代表不进位 99 代表进位。根据这些第 xx 位是否进位的信息,我们可以求出所有的 lil_i
于是我们就有不等式组 li×10xA+Bi<(li+1)×10xl_i\times10^x\le A+Bi<(l_i+1)\times10^x。设 A=A10x,B=B10xA'=\dfrac{A}{10^x},B'=\dfrac{B}{10^x},同时除以 10x10^x 得到 liA+Bi<li+1l_i\le A'+B'i<l_i+1
从小到大枚举 xx,因为 d00d_0\neq 0,故如果此时存在 AA 必有 10xA<10x+110^x\le A<10^{x+1}。枚举到第一个存在 AAxx 就可以直接输出答案了。
问题转化为给定平面上若干线段 x=i,y[li,li+1)x=i,y\in[l_i,l_i+1),求是否存在一条斜率为 BB' 截距为 AA' 的直线穿过所有线段,若存在求 AA' 最小值。
发现若 BB' 存在,必然存在某条直线穿过某个 (i,li)(i,l_i) 使得 AA' 也存在,且 BB' 越大 AA' 越小。所以我们只需要求 BB' 的取值范围即可,而且这个范围和 xx 无关。
记点集 P={(i,li)i=0,1,n}Q={(i,li+1)i=0,1,n}P=\{(i,l_i)|i=0,1,\cdots n\},Q=\{(i,l_i+1)|i=0,1,\cdots n\},限制改写成 PP 都在直线上或在直线下方,QQ 都在直线上方。
进一步的,你发现只有 PP 的上凸壳和 QQ 的下凸壳中的点会做出贡献。设凸包大小为 kk
求出凸包后,斜率具有单调性,双指针的时间复杂度 O(k)O(k)。直接枚举点对是 O(k2)O(k^2)
官方题解说 k=O(n23)k=O(n^{\frac 2 3}),所以上面两种方法都是可行的。
答案的上界是 O(n2)O(n^2),所以枚举 xx 的复杂度是 O(logn)O(\log n),不是瓶颈。
总的时间复杂度是 O(n)O(n)O(n43)O(n^{\frac 4 3}),取决于找 BB' 的范围如何实现。
好吧,最后懒了,考虑到题目年代久远,n104n\le 10^4O(n2)O(n^2) 都能跑。

代码

CPP
#include<bits/stdc++.h>
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
#define ll long long
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
using namespace std;
const int MAXN=1e4+2;
const double EPS=1e-9;
char s[MAXN];
int n,d[MAXN],l[MAXN];
set<int>delta;
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	cin>>s;
	n=strlen(s);
	F(i,0,n-1) d[i]=s[i]-'0';
	F(i,0,n-2) delta.insert((d[i+1]-d[i]+10)%10);
	if(delta.size()>2) return cout<<"-1",0;
	if(delta.size()==1||n==1) return cout<<d[0],0;
	int x=*delta.begin(),y=*delta.rbegin();
	if((x-y+10)%10!=1&&(y-x+10)%10!=1) return cout<<"-1",0;
	l[0]=d[0];
	if((y-x+10)%10==9) x=9,y=10;
	F(i,1,n-1){
		if((l[i-1]+x)%10==d[i]) l[i]=l[i-1]+x;
		else l[i]=l[i-1]+y;
	}
	double bl=0,br=1e9;
	F(i,0,n-1) F(j,i+1,n-1){
		bl=max(bl,(l[j]-l[i]-1.0+EPS)/(j-i));
		br=min(br,(l[j]+1.0-l[i]-EPS)/(j-i));
	}
	if(bl>br) return cout<<"-1",0;
	for(int i=1;;i*=10) if(ceil(bl*i)<=floor(br*i)){
		int b=floor(br*i),res=0;
		F(j,0,n-1) res=max(res,l[j]*i-j*b);
		return cout<<res,0;
	}
	return 0;
}#include<bits/stdc++.h>
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
#define ll long long
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
using namespace std;
const int MAXN=1e4+2;
const double EPS=1e-9;
char s[MAXN];
int n,d[MAXN],l[MAXN];
set<int>delta;
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	cin>>s;
	n=strlen(s);
	F(i,0,n-1) d[i]=s[i]-'0';
	F(i,0,n-2) delta.insert((d[i+1]-d[i]+10)%10);
	if(delta.size()>2) return cout<<"-1",0;
	if(delta.size()==1||n==1) return cout<<d[0],0;
	int x=*delta.begin(),y=*delta.rbegin();
	if((x-y+10)%10!=1&&(y-x+10)%10!=1) return cout<<"-1",0;
	l[0]=d[0];
	if((y-x+10)%10==9) x=9,y=10;
	F(i,1,n-1){
		if((l[i-1]+x)%10==d[i]) l[i]=l[i-1]+x;
		else l[i]=l[i-1]+y;
	}
	double bl=0,br=1e9;
	F(i,0,n-1) F(j,i+1,n-1){
		bl=max(bl,(l[j]-l[i]-1.0+EPS)/(j-i));
		br=min(br,(l[j]+1.0-l[i]-EPS)/(j-i));
	}
	if(bl>br) return cout<<"-1",0;
	for(int i=1;;i*=10) if(ceil(bl*i)<=floor(br*i)){
		int b=floor(br*i),res=0;
		F(j,0,n-1) res=max(res,l[j]*i-j*b);
		return cout<<res,0;
	}
	return 0;
}

Day 88

考查选手补题能力。

题意

TT 次询问 n,a,bn,a,b,求正整数 l,rl,r 满足区间 [l,r][l,r]aa 的倍数个数比 bb 的倍数个数恰好多 nn 个,最大化 rlr-l,在此基础上最小化 ll

思路

f(l,r)=i=lr([ai][bi])f(l,r)=\sum\limits_{i=l}^r{([a|i]-[b|i])}
首先发现若 f(l,r)=nf(l,r)=n, nn 减小时 rlr-l 不升,所以可以把恰好 nn 个的限制变成至多 nn 个。
那么最优的 l,rl,r 一定满足 al1,ar+1a|l-1,a|r+1,否则把区间向外扩 f(l,r)f(l,r) 不会增大,仍然满足限制且更优。不难发现这也描述了 l=1l=1 这个不能向外扩的情况。
于是设 l=pa+1,r=qa1l=pa+1,r=qa-1,最大化 rl=(qp)a2r-l=(q-p)a-2 就是最大化 qpq-p
区间 [l,r][l,r]aa 的倍数的个数为 qp1q-p-1,想要 qpq-p 最大就需要区间内 bb 的倍数个数最大,而这就要求区间内 bb 的倍数第一次出现的位置 tt 尽可能小,也就是 tlt-l 尽可能小。
不妨设 t=tbt=t'b,则 tl=tbpa1t-l=t'b-pa-1,即 tl+1=tbpat-l+1=t'b-pa。把 t,pt',p 视为未知数,根据裴蜀定理,这个方程有解当且仅当 gcd(a,b)tl+1\gcd(a,b)|t-l+1。故 tlt-l 的最小值为 gcd(a,b)1\gcd(a,b)-1
tl=gcd(a,b)1t-l=\gcd(a,b)-1 时,bb 的倍数出现次数为 (qp)agcd(a,b)b=(qp)agcd(a,b)1b+1\lceil\dfrac{(q-p)a-\gcd(a,b)}{b}\rceil=\lfloor\dfrac{(q-p)a-\gcd(a,b)-1}{b}\rfloor+1
所以 f(l,r)=qp2(qp)agcd(a,b)1bnf(l,r)=q-p-2-\lfloor\dfrac{(q-p)a-\gcd(a,b)-1}{b}\rfloor\le n。这个式子关于 qpq-p 单调,可以二分出 qpq-p 的最大值。下面我们认为 qpq-p 已经确定且最大。
接下来是最小化 ll,即最小化 pp
回到题目本身的限制,我们要有 [l,r][l,r] 中出现至少 qp1nq-p-1-nbb 的倍数。设 k=qp1nk=q-p-1-n,则 rl(rmodb)b(k1)r-l-(r\bmod b)\ge b(k-1),即 (pa+(qp)a1)modb(qp)a2b(k1)(pa+(q-p)a-1)\bmod b\le (q-p)a-2-b(k-1)
如果 (qp)a2b(k1)b(q-p)a-2-b(k-1)\ge b,无论如何这个不等式都成立,取 l=1l=1 即可。
否则,化简不等式得到 (pa)modb(1(qp)a)modb(pa)\bmod b\ge(1-(q-p)a)\bmod b。我们要求满足这个式子的最小的 pp
这是经典问题。设 g(u,v,t,m)g(u,v,t,m) 表示满足 u(tx)modmvu\le(tx)\bmod m\le v 的最小的非负整数 xx,其中 u,v,t[0,m)u,v,t\in[0,m)。注意此处 tt 和上面没有关系。那么此时答案为 g((1(qp)a)modb,b1,a,b)g((1-(q-p)a)\bmod b,b-1,a,b)。接下来研究 gg 如何求。
如果 [u,v][u,v] 中有 tt 的倍数,则 g(u,v,t,m)=utg(u,v,t,m)=\lceil\dfrac u t\rceil;如果 u=0u=0,则 g(u,v,t,m)=0g(u,v,t,m)=0,这两种情况好处理的。
否则我们设 s=txms=\lfloor\dfrac{tx}m\rfloor,不等式转化为 utxsmvu\le tx-sm\le v
由于 [u,v][u,v] 中没有 tt 的倍数,不等式两边同时对 tt 取模再乘 1-1,得到 (v)modt(sm)modt(u)modt(-v)\bmod t\le(sm)\bmod t\le(-u)\bmod t。这是一个子问题,取 s=g((v)modt,(u)modt,mmodt,t)s=g((-v)\bmod t,(-u)\bmod t,m\bmod t,t) 即可回带求出 xx 最小值。
时间复杂度同辗转相除为 O(Tlogn)O(T\log n)

代码

CPP
#include<bits/stdc++.h>
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
#define ll long long
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
using namespace std;
ll n,a,b; 
ll g(ll u,ll v,ll t,ll m){
	if(u==0) return 0;
	if(((u-1)/t+1)*t<=v) return (u-1)/t+1;
	ll s=g((t-v%t)%t,(t-u%t)%t,m%t,t);
	return (s*m+u-1)/t+1;
}
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	int T;
	for(cin>>T;T;--T){
		cin>>n>>a>>b;
		ll ql=0,qr=1e12,d=__gcd(a,b);
		while(ql<qr){
			ll mid((ql+qr)>>1);
			if(mid-2-(mid*a-d-1)/b<=n) ql=mid+1;
			else qr=mid;
		}
		ll len=ql-1,p,q;
		if(len*a-2-b*(len-2-n)>=b) p=0;
		else p=g(((1-len*a)%b+b)%b,b-1,a,b);
		q=p+len;
		cout<<p*a+1<<" "<<q*a-1<<"\n";
	}
	return 0;
}

Day 89

春晚太无聊了,来看看很久远的题目,完成五年前的约定。

题意

TT 次询问,每次给定 A,B,CA,B,C,对 t=0,1,2t=0,1,2i=1Aj=1Bk=1C(lcm(i,j)gcd(i,k))f(t)\prod\limits_{i=1}^A\prod\limits_{j=1}^B\prod\limits_{k=1}^C\left(\dfrac{\operatorname{lcm}(i,j)}{\gcd(i,k)}\right)^{f(t)},其中 f(0)=1,f(1)=ijk,f(2)=gcd(i,j,k)f(0)=1,f(1)=ijk,f(2)=\gcd(i,j,k)。答案对质数 pp 取模。

思路

一眼莫反。接下来认为 A,B,C=O(n)A,B,C=O(n)
首先 lcm\operatorname{lcm}gcd\gcd 得到原式为 i=1Aj=1Bk=1C(ijgcd(i,j)gcd(i,k))f(t)\prod\limits_{i=1}^A\prod\limits_{j=1}^B\prod\limits_{k=1}^C\left(\dfrac{ij}{\gcd(i,j)\gcd(i,k)}\right)^{f(t)}
g(a,b,c)=i=1aj=1bk=1cif(t),h(a,b,c)=i=1aj=1bk=1cgcd(i,j)g(a,b,c)=\prod\limits_{i=1}^a\prod\limits_{j=1}^b\prod\limits_{k=1}^c i^{f(t)},h(a,b,c)=\prod\limits_{i=1}^a\prod\limits_{j=1}^b\prod\limits_{k=1}^c\gcd(i,j),则原式为
g(a,b,c)g(b,a,c)h(a,b,c)h(a,c,b)\dfrac{g(a,b,c)g(b,a,c)}{h(a,b,c)h(a,c,b)}

t=0t=0,求 gg

写出所求式 i=1aj=1bk=1ci\prod\limits_{i=1}^a\prod\limits_{j=1}^b\prod\limits_{k=1}^c i
交换求积顺序 j=1bk=1ca!\prod\limits_{j=1}^b\prod\limits_{k=1}^c a!
即有:
g(a,b,c)=(a!)bcg(a,b,c)=(a!)^{bc}
预处理阶乘可以做到单次 O(logn)O(\log n)

t=0t=0,求 hh

写出所求式 i=1aj=1bk=1cgcd(i,j)\prod\limits_{i=1}^a\prod\limits_{j=1}^b\prod\limits_{k=1}^c\gcd(i,j)
不妨假设 aba\le b
整理,枚举 gcd\gcd 得到(k=1ai=1aj=1bk[gcd(i,j)=k])c\left(\prod\limits_{k=1}^a\prod\limits_{i=1}^a\prod\limits_{j=1}^b k^{[gcd(i,j)=k]}\right)^c
化简一下有 (k=1aki=1aj=1b[gcd(i,j)=k])c\left(\prod\limits_{k=1}^a k^{\sum\limits_{i=1}^a\sum\limits_{j=1}^b[gcd(i,j)=k]}\right)^c
指数上是这道题,化简过程不再重复。结果是 (k=1akd=1akμ(d)akdbkd)c\left(\prod\limits_{k=1}^a k^{\sum\limits_{d=1}^{\lfloor\frac{a}{k}\rfloor}\mu(d)\lfloor\frac{a}{kd}\rfloor\lfloor\frac{b}{kd}\rfloor}\right)^c
枚举 kk 变为枚举 kd=xkd=x,得到最终结果:
ab,h(a,b,c)=x=1a(kxkμ(xk))axbxca\le b,h(a,b,c)=\prod\limits_{x=1}^a\left(\prod\limits_{k|x}k^{\mu(\frac x k)}\right)^{\lfloor\frac{a}{x}\rfloor\lfloor\frac{b}{x}\rfloor c}
括号里的东西可以 O(nlogn)O(n\log n) 或狄利克雷前缀和 O(nloglogn)O(n\log\log n) 预处理,然后就可以整除分块加快速幂 O(nlogn)O(\sqrt n\log n) 查询。

t=1t=1,求 gg

写出所求式 i=1aj=1bk=1ciijk\prod\limits_{i=1}^a\prod\limits_{j=1}^b\prod\limits_{k=1}^c i^{ijk}
i=1aiij=1bk=1cjk\prod\limits_{i=1}^a i^{i\sum\limits_{j=1}^b\sum\limits_{k=1}^c jk}
等差数列求和随便化简一下得到 i=1aiib(b+1)2c(c+1)2\prod\limits_{i=1}^ai^{i\frac{b(b+1)}{2}\frac{c(c+1)}{2}}
即有:
g(a,b,c)=(i=1aii)b(b+1)c(c+1)4g(a,b,c)=\left(\prod\limits_{i=1}^a i^i\right)^{\frac{b(b+1)c(c+1)}{4}}
O(nlogn)O(n\log n) 预处理括号里的东西可以做到单次 O(logn)O(\log n)

t=1t=1,求 hh

写出所求式 i=1aj=1bk=1cgcd(i,j)ijk\prod\limits_{i=1}^a\prod\limits_{j=1}^b\prod\limits_{k=1}^c \gcd(i,j)^{ijk}
(i=1aj=1bgcd(i,j)ij)c(c+1)2\left(\prod\limits_{i=1}^a\prod\limits_{j=1}^b \gcd(i,j)^{ij}\right)^{\frac{c(c+1)}{2}}
不妨设 aba\le b
然后枚举 gcd\gcd(k=1aki=1aj=1b[gcd(i,j)=k]ij)c(c+1)2\left(\prod\limits_{k=1}^a k^{\sum\limits_{i=1}^a\sum\limits_{j=1}^b[gcd(i,j)=k]ij}\right)^{\frac{c(c+1)}{2}}
gcd\gcd 化为 11 得到 (k=1akk2i=1akj=1bk[gcd(i,j)=1]ij)c(c+1)2\left(\prod\limits_{k=1}^a k^{k^2\sum\limits_{i=1}^{\lfloor\frac a k\rfloor}\sum\limits_{j=1}^{\lfloor\frac b k\rfloor}[gcd(i,j)=1]ij}\right)^{\frac{c(c+1)}{2}}
典中典莫反 (k=1akk2i=1akj=1bkijdi,djμ(d))c(c+1)2\left(\prod\limits_{k=1}^a k^{k^2\sum\limits_{i=1}^{\lfloor\frac a k\rfloor}\sum\limits_{j=1}^{\lfloor\frac b k\rfloor}ij\sum\limits_{d|i,d|j}\mu(d)}\right)^{\frac{c(c+1)}{2}}
枚举因数变枚举倍数 (k=1akk2d=1akμ(d)d2i=1akdij=1bkdj)c(c+1)2\left(\prod\limits_{k=1}^a k^{k^2\sum\limits_{d=1}^{\lfloor\frac a {k}\rfloor}\mu(d)d^2\sum\limits_{i=1}^{\lfloor\frac a {kd}\rfloor}i\sum\limits_{j=1}^{\lfloor\frac b {kd}\rfloor}j}\right)^{\frac{c(c+1)}{2}}
等差数列求和得到 (k=1akk2d=1akμ(d)d2akd(akd+1)2bkd(bkd+1)2)c(c+1)2\left(\prod\limits_{k=1}^a k^{k^2\sum\limits_{d=1}^{\lfloor\frac a {k}\rfloor}\mu(d)d^2\frac{\lfloor\frac a {kd}\rfloor(\lfloor\frac a {kd}\rfloor+1)}{2}\frac{\lfloor\frac b {kd}\rfloor(\lfloor\frac b {kd}\rfloor+1)}{2}}\right)^{\frac{c(c+1)}{2}}
枚举 kd=xkd=x,有最终式子:
ab,h(a,b,c)=x=1a(kxkμ(xk))x2ax(ax+1)2bx(bx+1)2c(c+1)2a\le b,h(a,b,c)=\prod\limits_{x=1}^a\left(\prod\limits_{k|x} k^{\mu(\frac x k)} \right)^{x^2\frac{\lfloor\frac a {x}\rfloor(\lfloor\frac a {x}\rfloor+1)}{2}\frac{\lfloor\frac b {x}\rfloor(\lfloor\frac b {x}\rfloor+1)}{2}\frac{c(c+1)}{2}}
预处理 O(nlogn)O(n\log n)O(nloglogn)O(n\log\log n),单次询问 O(nlogn)O(\sqrt n\log n)

t=2t=2,求 gg

写出所求式 i=1aj=1bk=1cigcd(i,j,k)\prod\limits_{i=1}^a\prod\limits_{j=1}^b\prod\limits_{k=1}^c i^{\gcd(i,j,k)}
化简有 i=1aij=1bk=1cgcd(i,j,k)\prod\limits_{i=1}^a i^{\sum\limits_{j=1}^b\sum\limits_{k=1}^c\gcd(i,j,k)}
进行欧拉反演,有 i=1aij=1bk=1cdi,dj,dkφ(d)\prod\limits_{i=1}^a i^{\sum\limits_{j=1}^b\sum\limits_{k=1}^c\sum\limits_{d|i,d|j,d|k}\varphi(d)}
枚举因数变为枚举倍数 i=1aidiφ(d)bdcd\prod\limits_{i=1}^a i^{\sum\limits_{d|i}\varphi(d)\lfloor\frac b {d}\rfloor\lfloor\frac c {d}\rfloor}
再来一次变成 d=1a(i=1adid)φ(d)bdcd\prod\limits_{d=1}^a\left(\prod\limits_{i=1}^{\lfloor\frac a {d}\rfloor} id\right)^{\varphi(d)\lfloor\frac b {d}\rfloor\lfloor\frac c {d}\rfloor}
展开得到 d=1a(dadad!)φ(d)bdcd\prod\limits_{d=1}^a\left(d^{\lfloor\frac a {d}\rfloor}\lfloor\dfrac a {d}\rfloor!\right)^{\varphi(d)\lfloor\frac b {d}\rfloor\lfloor\frac c {d}\rfloor}
即有:
g(a,b,c)=d=1a(dφ(d))adbdcd(ad!)φ(d)bdcdg(a,b,c)=\prod\limits_{d=1}^a(d^{\varphi(d)})^{\lfloor\frac a {d}\rfloor\lfloor\frac b {d}\rfloor\lfloor\frac c {d}\rfloor}\left(\lfloor\dfrac a {d}\rfloor!\right)^{\varphi(d)\lfloor\frac b {d}\rfloor\lfloor\frac c {d}\rfloor}
可以 O(nlogn)O(n\log n) 预处理,单次整除分块 O(nlogn)O(\sqrt n\log n)

t=2t=2,求 hh

大的要来了。
写出所求式 i=1aj=1bk=1cgcd(i,j)gcd(i,j,k)\prod\limits_{i=1}^a\prod\limits_{j=1}^b\prod\limits_{k=1}^c \gcd(i,j)^{\gcd(i,j,k)}
不妨设 aba\le b
枚举 gcd(i,j)=x\gcd(i,j)=x,有 i=1aj=1bk=1cx=1ax[gcd(i,j)=x]gcd(x,k)\prod\limits_{i=1}^a\prod\limits_{j=1}^b\prod\limits_{k=1}^c \prod\limits_{x=1}^a x^{[\gcd(i,j)=x]\gcd(x,k)}
化简一下,有 x=1axk=1cgcd(x,k)i=1aj=1b[gcd(i,j)=x]\prod\limits_{x=1}^a x^{\sum\limits_{k=1}^c\gcd(x,k)\sum\limits_{i=1}^a\sum\limits_{j=1}^b [\gcd(i,j)=x]}
指数的后两个求和是经典问题,上面已经提到过,代入得 x=1axd=1axμ(d)axdbxdk=1cgcd(x,k)\prod\limits_{x=1}^a x^{\sum\limits_{d=1}^{\lfloor\frac{a}{x}\rfloor}\mu(d)\lfloor\frac{a}{xd}\rfloor\lfloor\frac{b}{xd}\rfloor\sum\limits_{k=1}^c\gcd(x,k)}
对后一个求和号进行欧拉反演,有 x=1ax(d=1axμ(d)axdbxd)k=1cdx,dkφ(d)\prod\limits_{x=1}^a x^{\left(\sum\limits_{d=1}^{\lfloor\frac{a}{x}\rfloor}\mu(d)\lfloor\frac{a}{xd}\rfloor\lfloor\frac{b}{xd}\rfloor\right)\sum\limits_{k=1}^c\sum\limits_{d|x,d|k}\varphi(d)}
枚举因数变枚举倍数有 x=1ax(d=1axμ(d)axdbxd)dxφ(d)cd\prod\limits_{x=1}^a x^{\left(\sum\limits_{d=1}^{\lfloor\frac{a}{x}\rfloor}\mu(d)\lfloor\frac{a}{xd}\rfloor\lfloor\frac{b}{xd}\rfloor\right)\sum\limits_{d|x}\varphi(d)\lfloor\frac c d\rfloor}
化简得到 x=1a(xdxφ(d)cd)d=1axμ(i)axdbxd\prod\limits_{x=1}^a \left(x^{\sum\limits_{d|x}\varphi(d)\lfloor\frac c d\rfloor}\right)^{\sum\limits_{d=1}^{\lfloor\frac{a}{x}\rfloor}\mu(i)\lfloor\frac{a}{xd}\rfloor\lfloor\frac{b}{xd}\rfloor}
可惜的是,括号里的式子没法预处理,我们必须继续化简。枚举因数变枚举倍数得 d=1ax=1ad(xd)φ(d)cdi=1axdμ(i)axdibxdi\prod\limits_{d=1}^a\prod\limits_{x=1}^{\lfloor\frac a d\rfloor} (xd)^{\varphi(d)\lfloor\frac c d\rfloor\sum\limits_{i=1}^{\lfloor\frac{a}{xd}\rfloor}\mu(i)\lfloor\frac{a}{xdi}\rfloor\lfloor\frac{b}{xdi}\rfloor}
分成 x,dx,d 分别计算得 (d=1ax=1adxφ(d)cdi=1axdμ(i)axdibxdi)(d=1ax=1addφ(d)cdi=1axdμ(i)axdibxdi)\left(\prod\limits_{d=1}^a\prod\limits_{x=1}^{\lfloor\frac a d\rfloor} x^{\varphi(d)\lfloor\frac c d\rfloor\sum\limits_{i=1}^{\lfloor\frac{a}{xd}\rfloor}\mu(i)\lfloor\frac{a}{xdi}\rfloor\lfloor\frac{b}{xdi}\rfloor}\right)\left(\prod\limits_{d=1}^a\prod\limits_{x=1}^{\lfloor\frac a d\rfloor} d^{\varphi(d)\lfloor\frac c d\rfloor\sum\limits_{i=1}^{\lfloor\frac{a}{xd}\rfloor}\mu(i)\lfloor\frac{a}{xdi}\rfloor\lfloor\frac{b}{xdi}\rfloor}\right)
先处理右边的括号。xx 丢到指数上有 (d=1ax=1adxφ(d)cdi=1axdμ(i)axdibxdi)(d=1adφ(d)cdx=1adi=1axdμ(i)axdibxdi)\left(\prod\limits_{d=1}^a\prod\limits_{x=1}^{\lfloor\frac a d\rfloor} x^{\varphi(d)\lfloor\frac c d\rfloor\sum\limits_{i=1}^{\lfloor\frac{a}{xd}\rfloor}\mu(i)\lfloor\frac{a}{xdi}\rfloor\lfloor\frac{b}{xdi}\rfloor}\right)\left(\prod\limits_{d=1}^a d^{\varphi(d)\lfloor\frac c d\rfloor\sum\limits_{x=1}^{\lfloor\frac a d\rfloor}\sum\limits_{i=1}^{\lfloor\frac{a}{xd}\rfloor}\mu(i)\lfloor\frac{a}{xdi}\rfloor\lfloor\frac{b}{xdi}\rfloor}\right)
枚举 xi=kxi=k,得 (d=1ax=1adxφ(d)cdi=1axdμ(i)axdibxdi)(d=1adφ(d)cdk=1adadkbdkikμ(i))\left(\prod\limits_{d=1}^a\prod\limits_{x=1}^{\lfloor\frac a d\rfloor} x^{\varphi(d)\lfloor\frac c d\rfloor\sum\limits_{i=1}^{\lfloor\frac{a}{xd}\rfloor}\mu(i)\lfloor\frac{a}{xdi}\rfloor\lfloor\frac{b}{xdi}\rfloor}\right)\left(\prod\limits_{d=1}^a d^{\varphi(d)\lfloor\frac c d\rfloor\sum\limits_{k=1}^{\lfloor\frac a d\rfloor}\lfloor\frac{a}{dk}\rfloor\lfloor\frac{b}{dk}\rfloor\sum\limits_{i|k}\mu(i)}\right)
代入 ikμ(i)=[k=1]\sum\limits_{i|k}\mu(i)=[k=1](d=1ax=1adxφ(d)cdi=1axdμ(i)axdibxdi)(d=1adφ(d)adbdcd)\left(\prod\limits_{d=1}^a\prod\limits_{x=1}^{\lfloor\frac a d\rfloor} x^{\varphi(d)\lfloor\frac c d\rfloor\sum\limits_{i=1}^{\lfloor\frac{a}{xd}\rfloor}\mu(i)\lfloor\frac{a}{xdi}\rfloor\lfloor\frac{b}{xdi}\rfloor}\right)\left(\prod\limits_{d=1}^a d^{\varphi(d)\lfloor\frac{a}{d}\rfloor\lfloor\frac{b}{d}\rfloor\lfloor\frac c d\rfloor}\right)
再处理左边的括号。枚举 xi=kxi=k,得到最终式子:
ab,h(a,b,c)=(d=1a(k=1ad(xkxμ(kx))adkbdk)φ(d)cd)(d=1adφ(d)adbdcd)a\le b,h(a,b,c)=\left(\prod\limits_{d=1}^a\left(\prod\limits_{k=1}^{\lfloor\frac a d\rfloor}\left(\prod\limits_{x|k}x^{\mu(\frac k x)}\right)^{\lfloor\frac{a}{dk}\rfloor\lfloor\frac{b}{dk}\rfloor}\right)^{\varphi(d)\lfloor\frac c d\rfloor}\right)\left(\prod\limits_{d=1}^a d^{\varphi(d)\lfloor\frac{a}{d}\rfloor\lfloor\frac{b}{d}\rfloor\lfloor\frac c d\rfloor}\right)
左边括号可以做到 O(nlogn)O(n\log n) 预处理最内层,整除分块套整除分块单次 O(n34logn)O(n^{\frac 3 4}\log n)。右边括号直接整除分块是 O(nlogn)O(\sqrt n\log n) 的。
然后你发现 h(a,b,c)h(a,b,c) 的右边那个括号和 g(a,b,c)g(a,b,c) 的前半部分消掉了,不需要处理。内层的整除分块就是 t=0t=0hh
总时间复杂度是 O(nlogn+Tn34logn)O(n\log n+Tn^{\frac 3 4}\log n)。应该可以用杜教筛预处理的技巧做到把指数降到 23\dfrac 2 3

代码

CPP
#include<bits/stdc++.h>
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
#define ll long long
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
using namespace std;
const int MAXN=1e5+1;
int MOD;
inline ll qpow(ll base,ll expo){
	ll res(1);
	while(expo){
		(expo&1)&&(res=res*base%MOD);
		expo>>=1,base=base*base%MOD;
	}
	return res;
}
bool vis[MAXN];
int pr[MAXN],cnt,mu[MAXN],phi[MAXN];
ll fact[MAXN],sum[MAXN],iimul[MAXN],dmu[MAXN],m1[MAXN],m2[MAXN],im1[MAXN],im2[MAXN];
inline void init(){
	mu[1]=phi[1]=1;
	F(i,2,MAXN-1){
		if(!vis[i]) pr[++cnt]=i,mu[i]=-1,phi[i]=i-1;
		F(j,1,cnt){
			ll k=i*pr[j];
			if(k>=MAXN) break;
			vis[k]=1;
			if(i%pr[j]) mu[k]=-mu[i],phi[k]=phi[i]*(pr[j]-1);
			else{
				phi[k]=phi[i]*pr[j];
				break;
			}
		}
	}
	fact[0]=iimul[0]=1;
	F(i,1,MAXN-1) dmu[i]=1,sum[i]=sum[i-1]+phi[i],fact[i]=fact[i-1]*i%MOD,iimul[i]=iimul[i-1]*qpow(i,i)%MOD;
	F(i,1,MAXN-1) if(mu[i]) for(int j=i,k=1;j<MAXN;j+=i,++k) dmu[j]=dmu[j]*(mu[i]==1?k:qpow(k,MOD-2))%MOD;
	m1[0]=m2[0]=1;
	F(i,1,MAXN-1) m1[i]=m1[i-1]*dmu[i]%MOD,m2[i]=m2[i-1]*qpow(dmu[i],i*1ll*i%(MOD-1))%MOD;
	F(i,0,MAXN-1) im1[i]=qpow(m1[i],MOD-2),im2[i]=qpow(m2[i],MOD-2);
	return;
}
#define C2(x) ((x+1ll)*x/2%(MOD-1))
inline ll g0(int a,int b,int c){
	return qpow(fact[a],b*1ll*c%(MOD-1));
}
inline ll h0(int a,int b,int c){
	ll res=1;
	if(a>b) swap(a,b);
	for(int l=1,r;l<=a;l=r+1){
		ll ta=a/l,tb=b/l;
		r=min(a/ta,b/tb);
		res=res*qpow(m1[r]*im1[l-1]%MOD,ta*tb%(MOD-1))%MOD; 
	}
	return qpow(res,c);
}
inline ll g1(int a,int b,int c){
	return qpow(iimul[a],C2(b)*C2(c)%(MOD-1));
}
inline ll h1(int a,int b,int c){
	ll res=1;
	if(a>b) swap(a,b);
	for(int l=1,r;l<=a;l=r+1){
		ll ta=a/l,tb=b/l;
		r=min(a/ta,b/tb);
		res=res*qpow(m2[r]*im2[l-1]%MOD,C2(ta)*C2(tb)%(MOD-1))%MOD; 
	}
	return qpow(res,C2(c)%(MOD-1));
}
inline ll g2(int a,int b,int c){
	ll res=1;
	int lim=min(a,min(b,c));
	for(int l=1,r;l<=lim;l=r+1){
		ll ta=a/l,tb=b/l,tc=c/l;
		r=min(a/ta,min(b/tb,c/tc));
		res=res*qpow(fact[ta],(sum[r]-sum[l-1])%(MOD-1)*tb%(MOD-1)*tc%(MOD-1))%MOD; 
	}
	return res;
}
inline ll h2(int a,int b,int c){
	ll res=1;
	int lim=min(a,min(b,c));
	for(int l=1,r;l<=lim;l=r+1){
		ll ta=a/l,tb=b/l,tc=c/l;
		r=min(a/ta,min(b/tb,c/tc));
		res=res*h0(ta,tb,(sum[r]-sum[l-1])%(MOD-1)*tc%(MOD-1))%MOD; 
	}
	return res;
}
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	int T;
	cin>>T>>MOD;
	for(init();T;--T){
		int A,B,C;
		cin>>A>>B>>C;
		cout<<g0(A,B,C)*g0(B,A,C)%MOD*qpow(h0(A,B,C)*h0(A,C,B)%MOD,MOD-2)%MOD<<" ";
		cout<<g1(A,B,C)*g1(B,A,C)%MOD*qpow(h1(A,B,C)*h1(A,C,B)%MOD,MOD-2)%MOD<<" ";
		cout<<g2(A,B,C)*g2(B,A,C)%MOD*qpow(h2(A,B,C)*h2(A,C,B)%MOD,MOD-2)%MOD<<"\n";
	}
	return 0;
}

Day 90

一坨题目。

题意

定义序列 P=(1,1,2,2,2,3,3,3,3,)P=(1,1,2,2,2,3,3,3,3,\cdots),即数 ii 出现了 i+1i+1 次且所有数不降的数列,下标从 11 开始。定义 Q1=1Q_1=1i2i\ge 2Qi=Qi1+QPiQ_i=Q_{i-1}+Q_{P_i}TT 次给定 nn 询问 QnQ_n

思路

不妨令 P0=Q0=0P_0=Q_0=0
把递推式展开得到 Qn=i=0nQPiQ_n=\sum\limits\limits_{i=0}^n Q_{P_i},即 QnQ_n 可以视为数列 QPnQ_{P_n} 的前缀和。
既然是求前缀和,我们可以使用有限微积分。
先写成有限微积分的形式 Qn=0n+1QPxΔxQ_n=\sum_{0}^{n+1} Q_{P_x}\Delta x
类比微积分的分部积分,对于有限微积分,我们有:
【分部求和法】 uΔv=uvEvΔu\sum u\Delta v=uv-\sum\mathrm E v\Delta u,其中 E\mathrm E 是位移算子。
对上面的定和式使用分部求和,得到 Qn=(xQPx)0n+10n+1(x+1)ΔQPxQ_n=(xQ_{P_x})|^{n+1}_0-\sum_0^{n+1}(x+1)\Delta Q_{P_x}
展开得到 Qn=(n+1)QPn+1i=0n(i+1)(QPi+1QPi)Q_n=(n+1)Q_{P_{n+1}}-\sum\limits_{i=0}^{n}(i+1)(Q_{P_{i+1}}-Q_{P_i})
i=ni=n 时单独拎出来,再令 ii+1i\leftarrow i+1,化简一下,得到:
Qn=nQPni=1n(i1)(QPiQPi1)Q_{n}=nQ_{P_n}-\sum\limits_{i=1}^n(i-1)(Q_{P_i}-Q_{P_{i-1}})
你发现大部分情况 QPiQPi1=0Q_{P_i}-Q_{P_{i-1}}=00\neq 0 的位置可以表示成 i(i+1)2,iPn\dfrac{i(i+1)}2,i\le P_n。于是上面的式子可以写成 Qn=nQPni=1Pn(i(i+1)21)(qjqj1)Q_n=nQ_{P_n}-\sum\limits_{i=1}^{P_n}(\dfrac{i(i+1)}2-1)(q_j-q_{j-1})
简单化简得到 Qn=nQPni=1Pn(i(i+1)21)qpjQ_n=nQ_{P_n}-\sum\limits_{i=1}^{P_n}(\dfrac{i(i+1)}2-1)q_{p_j}。右边又是一个类似的求和式。
于是设 f0(n)=1,Fk(n)=i=1nfk(i),fk+1(n)=Fk(n(n+1)21)f_0(n)=1,F_k(n)=\sum\limits_{i=1}^n f_k(i),f_{k+1}(n)=F_k(\dfrac{n(n+1)}{2}-1),再设 g(n,k)=Fk(n)qpni=1pnfk+1(i)qpig(n,k)=F_k(n)q_{p_n}-\sum\limits_{i=1}^{p_n}f_{k+1}(i)q_{p_i}
则有:
qn=g(n,0)q_n=g(n,0)
g(n,k)=Fk(n)g(pn,0)g(pn,k+1)g(n,k)=F_k(n)g(p_n,0)-g(p_n,k+1)
kk 每增大 11 都会让 nn 大小开根号,四层后 n800n\le 800,可以预处理。f,Ff,F 是多项式,不超过 3131 项,可以预处理点值,计算时拉插。
如果仅仅只是上面那些,这道题还到不了蜜月日记 Day 90。真正的难点在于需要压位高精度,且在拉插中高精乘除常数过大,需要对若干个大质数取模再 CRT 起来。
当然你也可以直接算出这个多项式的值,不过感觉高精度多项式乘法非常抽象。
还有计算 PP 需要高精度根号这种抽象东西。直接二分吧。
时间复杂度能过。

代码

CPP
#include<bits/stdc++.h>
#define F(i,a,b) for(int i(a),i##i##end(b);i<=i##i##end;++i)
#define R(i,a,b) for(int i(a),i##i##end(b);i>=i##i##end;--i)
#define ll long long
#define File(a) freopen(#a".in","r",stdin);freopen(#a".out","w",stdout)
using namespace std;
const int B=1e9,LEN=10,MAXN=801,MAXD=36,MAXM=10,Mod[MAXM]={0,1000000297,1000000321,1000000349,1000000363,1000000403,1000000409,1000000411,1000000427,1000000433};
struct Bigint{
	ll v[LEN+1]={};
	inline void output(){
		bool notzero=0;
		R(i,LEN,0){
			int now=1e9;
			R(j,8,0){
				now/=10;
				int qwq=(v[i]/now)%10;
				if(qwq) notzero=1;
				if(notzero) cout<<qwq;
			}
		}
		if(!notzero) cout<<"0";
		cout<<"\n";
		return;
	}
	void trans(string s){
		reverse(s.begin(),s.end());
		int l,r=-1;
		F(i,0,LEN){
			v[i]=0,l=r+1,r=min(l+8,int(s.size())-1);
			R(j,r,l) v[i]=v[i]*10+(s[j]-'0');
		}
		return;
	}
	void trans(__int128 s){
		memset(v,0,sizeof(v));
		int pos=0;
		while(s) v[pos]=s%B,s/=B,++pos;
		return;
	}
	Bigint operator+(const Bigint&x)const{
		Bigint res;
		F(i,0,LEN) res.v[i]=v[i]+x.v[i];
		F(i,0,LEN) res.v[i]>=B&&(res.v[i]-=B,++res.v[i+1]);
		return res;
	}
	Bigint operator+(const __int128&x)const{
		Bigint tmp;
		tmp.trans(x);
		return *this+tmp;
	}
	Bigint operator-(const Bigint&x)const{
		Bigint res;
		F(i,0,LEN) res.v[i]=v[i]-x.v[i];
		F(i,0,LEN) res.v[i]<0&&(res.v[i]+=B,--res.v[i+1]);
		return res;
	}
	Bigint operator*(const Bigint&x)const{
		Bigint res;
		F(i,0,LEN) F(j,0,i){
			res.v[i]+=v[j]*x.v[i-j];
			res.v[i]>=B&&(res.v[i+1]+=res.v[i]/B,res.v[i]%=B);
		}
		return res;
	}
	Bigint operator*(const ll&x)const{
		Bigint res;
		F(i,0,LEN) res.v[i]=v[i]*x;
		F(i,0,LEN) res.v[i]>=B&&(res.v[i+1]+=res.v[i]/B,res.v[i]%=B);
		return res;
	}
	Bigint operator/(const ll&x)const{
		Bigint res;
		ll rem=0;
		R(i,LEN,0) rem=rem*B+v[i],res.v[i]=rem/x,rem%=x;
		return res;
	}
	ll operator%(const ll&x)const{
		ll rem=0;
		R(i,LEN,0) rem=rem*B+v[i],rem%=x;
		return rem;
	}
	Bigint operator%(const Bigint&x)const{
		Bigint rem,tmp;
		R(i,LEN,0){
			int now=1e9;
			R(j,8,0){
				now/=10;
				rem=rem*10+(v[i]/now)%10;
				while(x<=rem) rem=rem-x;
			}
		}
		return rem;
	}
	bool operator<(const Bigint&x)const{
		R(i,LEN,0){
			if(v[i]<x.v[i]) return 1;
			if(v[i]>x.v[i]) return 0;
		}
		return 0;
	} 
	bool operator<=(const Bigint&x)const{
		R(i,LEN,0){
			if(v[i]<x.v[i]) return 1;
			if(v[i]>x.v[i]) return 0;
		}
		return 1;
	} 
	
};
ll qpow(ll base,int expo,int MOD){
	ll res(1);
	while(expo){
		(expo&1)&&(res=res*base%MOD);
		expo>>=1,base=base*base%MOD;
	}
	return res;
}
int P[MAXN],Q[MAXN];
inline void initPQ(){
	for(int l=1,r,i=1;l<MAXN;l=r+1,++i){
		r=min(l+i,MAXN-1);
		F(j,l,r) P[j]=i;
	}
	Q[1]=1;
	F(i,2,MAXN-1) Q[i]=Q[i-1]+Q[P[i]];
	return;
}
inline Bigint findP(Bigint n){
	__int128 l=1,r=__int128(2000000000)*100000000001ll;
	Bigint t,t1;
	while(l<r){
		__int128 mid=(l+r)>>1;
		t.trans(mid),t1.trans(mid+1);
		if(n*2<t*t1) r=mid;
		else l=mid+1;
	}
	t.trans(l-1);
	return t;
} 
Bigint M,pn[5],maxn,inv[MAXM];
struct CRT{
	int MOD;
	int fv[5][MAXD],Fv[5][MAXD],mem[5][MAXN];
	ll mo[MAXD];
	inline ll f(int k,int n){
		if(n<MAXD) return fv[k][n];
		static ll pre[MAXD+1],suf[MAXD+1];
		int res=0;
		pre[0]=suf[MAXD]=1;
		F(i,1,MAXD) pre[i]=pre[i-1]*(n-i)%MOD;
		R(i,MAXD-1,0) suf[i]=suf[i+1]*(n-i)%MOD;
		F(i,1,MAXD-1) res=(res+pre[i-1]*suf[i+1]%MOD*mo[i]%MOD*fv[k][i])%MOD;
		return res;
	}
	inline ll FF(int k,Bigint x){
		static ll pre[MAXD+1],suf[MAXD+1];
		int res=0,n=x%MOD;
		if(n<MAXD) return Fv[k][n];
		pre[0]=suf[MAXD]=1;
		F(i,1,MAXD) pre[i]=pre[i-1]*(n-i)%MOD;
		R(i,MAXD-1,0) suf[i]=suf[i+1]*(n-i)%MOD;
		F(i,1,MAXD-1) res=(res+pre[i-1]*suf[i+1]%MOD*mo[i]%MOD*Fv[k][i])%MOD;
		return res;
	}
	inline void main(){
		static ll pre[MAXD+1],suf[MAXD+1];
		pre[0]=suf[0]=1;
		F(i,1,MAXD-1) pre[i]=pre[i-1]*i%MOD,suf[i]=suf[i-1]*(MOD-i)%MOD;
		F(i,1,MAXD-1) mo[i]=qpow(pre[i-1]*suf[MAXD-1-i]%MOD,MOD-2,MOD);
		F(i,1,MAXD-1) fv[0][i]=1,Fv[0][i]=i;
		F(i,1,4) F(j,1,MAXD-1){
			Bigint tmp;
			tmp.trans(j*(j+1ll)/2-1);
			fv[i][j]=FF(i-1,tmp),(Fv[i][j]=Fv[i][j-1]+fv[i][j])>=MOD&&(Fv[i][j]-=MOD); 
		}
		F(i,0,4) F(j,1,MAXN-1) mem[i][j]=(mem[i][j-1]+f(i,j)*Q[P[j]])%MOD;
		return;
	}
	ll g(int k,int dep){
		Bigint nn=pn[dep-1];
		if(nn<maxn) return mem[k][nn.v[0]];
		return ((FF(k,nn)*g(0,dep+1)-g(k+1,dep+1))%MOD+MOD)%MOD;
	}
}initFG[MAXM];
signed main(){
	ios::sync_with_stdio(0);
	cin.tie(0),cout.tie(0);
	initPQ();
	M.trans(1),maxn.trans(MAXN);
	F(i,1,MAXM-1) M=M*Mod[i],initFG[i].MOD=Mod[i];
	F(i,1,MAXM-1) initFG[i].main(),inv[i]=(M/Mod[i])*(qpow((M/Mod[i])%Mod[i],Mod[i]-2,Mod[i]));
	int T;
	for(cin>>T;T;--T){
		string str;
		cin>>str;
		Bigint n;
		n.trans(str);
		pn[0]=n;
		F(i,1,4) pn[i]=findP(pn[i-1]);
		Bigint ans;
		F(i,1,MAXM-1) ans=ans+inv[i]*initFG[i].g(0,1);
		ans=ans%M;
		ans.output();
	} 
	return 0;
}

后记

下一季冲刺 Day 100。

评论

0 条评论,欢迎与作者交流。

正在加载评论...