0. 前言
由于作者水平不高,所以可能会出现很多错误,求轻喷qwq。
1. 转置原理的概念
首先先明确我们所研究的对象,也即线性算法。
它支持输入一个长度为
n 的输入向量
x,然后输出一个长度为
m 的输出向量
y,且有常数矩阵
A 满足对任意合法的
x,y 都满足
y=Ax。
我们定义一个线性算法
y=Ax 的转置即为
y′=ATx′。
而转置原理断言可以在时空复杂度不变的情况下将一个线性算法改为其转置算法。
那么如果我们可以对一个算法的转置进行优化,那么我们只需将执行过程转置过来就可以得到原算法的优化方法。
但值得注意的的是,转置原理并不是提出了解决问题的算法,而是建立了问题相互转化的桥梁。一个问题转置之后不一定会变成更简单的问题,但可以改变我们认知问题的角度和方式。
2. 应用
0. 初等矩阵的转置
初等矩阵根据作用可分为三类
- 交换两行
- 给一行乘常数
- 将一行乘常数加到另一行
写成算法就是:
- ai↔aj
- ai←ai×k
- ai←ai+aj×k
再写出他们的转置
- 第一类初等矩阵显然为对称阵,所以仍是 ai↔aj
- 第二类由于只在主对角线上有值,显然转置之后不变,ai←ai×k
- 转置之后原来在 (i,j) 上的 k 会转置到 (j,i),因此变为 aj←aj+ai×k
1. 多项式乘法的转置
考察多项式乘法
a←a×b。
考虑一个矩阵
Ci,j=bi−j,那么相当于
a←Ca。
那么其转置
a←CTa 的第
i 位就是
∑i≤jajbj−i,也即
a 和
b 的差卷积,下文会以
×T 表示多项式乘法的转置。
2. 转置原理优化 FFT
正常使用的 FFT 一般是 DIF-FFT,通过奇偶分类拆解为子问题,非递归版本可简单分为两个部分:蝴蝶变换与迭代,我们分别称其为线性算法
B 和
P。
而我们知道
P×B=F=(ωnij)i,j,那么
F=FT,而显然
B=BT 则
P×B=B×PT
那么常规的多项式乘法的流程即为:
a←B×a,a←P×a
b←B×b,b←P×b
a←a⋅b
a←B×a,a←P×a,a←a⋅n1
考虑将 FFT 转置:
a←PT×a,a←B×a
b←PT×b,b←B×b
a←a⋅b
a←B×a,a←P×a,a←a⋅n1
而
B2=I,那么我们可以在 DFT 时做
PT 然后在 IDFT 时做
P,这样就省去了三遍蝴蝶变换,我们一般称这种技巧为 DIT-DIF。
3. 转置原理优化多项式除法
规定两个求两个长度为
n 的多项式的乘法的时间为
M(n),而求一个多项式的逆的时间为
D(n)。
现在有多项式除法
F(x)=Q(x)G(x)+R(x),令
n=degF,m=degG,假设
2m=n。
根据普通的多项式除法,我们计算
Q(x) 需要
M(m)+D(m) 的时间,而计算
R(x) 又需要额外的
M(m) 的时间,那么算出
R(x) 就需要花费整整
2M(m)+D(m)。
考虑直接写出
R(x),那么
rk=∑ifi[xk](ximodG(x))。将其转置,可得
rkT=∑ifi[xi](xkmodG(x))=∑i[xn−i]FR(x)[xi](xkmodG(x))=[xn]FR(x)(xkmodG(x))。
而我们有恒等式:
[xn]FR(x)(xkmodG(x))=[xk]GR(x)(F(x)GR(x))modxm
这里是证明,不想看可以直接跳
我们发现如果
GR(x) 是一个递推数列的特征多项式而且
F(x) 是这个数列的第
0∼n 项,那么这个式子描述的就是常系数齐次线性递推中的 Fiduccia 算法与 LSB-First 算法,于是考虑从线性递推角度入手。
首先考虑
k<m 时的情况,此时左式为
[xk]F(x)。考虑右式,由于
m>k 故右式分子的前
k+1 项与
F(x)GR(x) 相同,故左式等于右式。
我们记
A(k)=[xn]FR(x)(xkmodG(x)),B(k)=[xk]GR(x)(F(x)GR(x))modxm,R(k)=xkmodG(x),P(x)=GR(x)(F(x)GR(x))modxm。
考虑
xkG(x)modG(x),显然这个东西为 0,将其展开:
xkG(x)=i=0∑mgixk+i≡i=0∑mgiR(k+i)≡0(modG(x))而我们又注意到
degR(k)<m,因此
i=0∑mgiR(k+i)=0,那么乘
FR(x) 后取
[xn] 即得
i=0∑mgiA(k+i)=0下证
i=0∑mgiB(k+i)=0。
那么
GR(x)P(x)=(F(x)GR(x))modxm,所以
0=[xk]GR(x)P(x),写出卷积形式:
[xk]GR(x)P(x)=i=0∑mgm−i[xk−i]S(x)=i=0∑mgm−iB(k−i)让
k→k+m,则
∑i=0mgm−iB(k−i)=∑i=0mgiB(m+i)因此数列
A,B 的前
m 项相同,且都服从同一个递推关系,故由线性递推数列的唯一性可知对任意
k 有
A(k)=B(k)。
那么我们现在要计算
rkT 只需要以下步骤:
- F←F×GR
- F←Fmodxm
- F←F×GR−1(x)
我们转置这个步骤便可得到计算
R(x) 的算法:
- F←F×TGR−1
- F←Fmodxm
- F←F×TGR(x)
而差卷积可以利用自然溢出做到
21M(m),那么我们计算
R(x) 只需要
M(m)+D(m)∼67M(n) 的计算量,和原来
2M(m)+D(m)∼35M(n) 的做法可谓有着天壤之别!
4. 转置原理优化多点求值
多点求值是一个典型的线性算法,设待求的点为
{x0,x1…xm},多项式为
F(x)=i=0∑nfixi,那么容易写出它的标准形式:
11⋮1x0x1⋮xm⋯⋯⋱⋯x0nx1n⋮xmnf0f1⋮fn
考虑转置
1x0⋮x0n1x1⋮x1n⋯⋯⋱⋯1xm⋮xmnv0v1⋮vn
这个东西是简单的,就是
i=0∑n1−xxivi。
我们用分治去计算这个东西,令
Tl,r=i=l∏r(1−xxi),那么令
Pl,r 表示分子部分,设分治点为
k,那么有
Pl,r=Pl,k×Tk+1,r+Pk+1,r×Tl,k。
最后计算
P1,n×T1,n−1 即可。
将此过程转置即可,注意原来分治的自下而上要改为自上而下。
3. 一类特殊矩阵的快速乘向量计算方法
1. 引入
考虑一个线性算法
y=Ax,现在设矩阵系数
Ai,j 的二元函数为
A(x,y)=∑i,jAi,jxiyj。
若我们可以将
A(x,y) 写作
A(x,y)=u(x)v(y)f(g(x)h(y)),且
g,h 由常数个下方提到的简单函数复合而成。那么如果
g,h 不含
exp 和
ln,则我们可以用
O(M(n)) 的复杂度该矩阵和逆矩阵左乘向量,否则需要
O(M(n)logn) 的复杂度。
为保证下文提到的所有运算有意义,我们还要求
gh 的常数项为 0,
u,v 常数项非 0,
f 每一项非 0。
2. 右复合
对于一个
degF=n−1 的多项式
F 来说,
F(G(x))modxn 称为一次右复合,写作
F∘G。
下面介绍一些简单函数的右复合。
加
F(x+k)=i=0∑n−1fi(x+k)i=i=0∑n−1fij=0∑i(ji)xjki−j=j=0∑n−1j!xji=j∑n−1fii!⋅(i−j)!ki−j
差卷积即可。
乘
F(kx),每项系数乘
ki 即可,
O(n)。
幂
F(xk),下标变换即可,
O(n)。
逆
F(x−1)=FR(x)x1−n,设下一个右复合的为
g,那么下一个右复合只需计算
FR∘g 和
g1−n,而计算
g1−n 只需
O(M(n))。
根
F(xk1)。还是设下一个右复合的为
g,设其有唯一的一个
h 使得
g=hk,我们定义
Fi(x)=∑jfjk+ixj,那么
F(h)=i=0∑k−1Fi(g)hi,复杂度
O(kM(n)),因此要求
k 为常数。
指
F(ex−1),这个形式是为了方便和对数互逆。
注意到减一可以扔掉,只考虑
F(ex)。
F(ex)=i=0∑n−1fieix=i=0∑n−1fij=0∑n−1j!ijxj=j=0∑n−1j!xji=0∑n−1fiij
那么我们相当于要对每个
i 算
∑j=0n−1fjji,显然可以直接分治 FFT,可以做到
O(M(n)logn)。我们还发现这个东西转置以后就是经典的多点求值形式,下面会用。
对
F(ln(1+x)),注意到直接做是困难的。
由于对指互逆,我们只要考虑复合指数做法的逆就行了。
虽然复合指数的逆也不简单,但是我们可以将两边都转置一下,多点求值的逆就是快速插值,那么也可以做到
O(M(n)logn)。
计算
Ai,j=k∑gikfkhjk
那么做变换
A 就相当于:右复合
g,点乘
f,右复合
h。
那么
u,v=1 的情况也类似,在开头和结尾处乘
u 和乘
v 的转置即可。