概要
如果你学过:
中文,英文;
初中数学;
集合,序列的定义;
复数的定义及加减乘;
模意义下运算,整数辗转相除法,Bezout 定理及其正确性证明;
Wilson 定理;
那么本文将会教会你:
Fermat 平方和定理的证明;
二元二次方程 x 2 + y 2 = a x^2+y^2=a x 2 + y 2 = a 的整数解计数以及零感性理解正确性证明,构造;
证明 π 4 = 1 1 − 1 3 + 1 5 − 1 7 + … \frac\pi4=\frac11-\frac13+\frac15-\frac17+\dots 4 π = 1 1 − 3 1 + 5 1 − 7 1 + … 。
希望没锅。
若无特殊说明,离散介值定理一章除外,本文所有区间
[ l , r ] [l,r] [ l , r ] 代表
[ l , r ] ∩ Z [l,r]\cap\Z [ l , r ] ∩ Z 。
本文所有定义使用方括号「」包裹。对于非正式名称,使用斜体。
【前置知识】环论
如果你对证明不感兴趣,可以跳过这一章节。
各种环的定义
定义 1:「环(Ring)」是一个配备了运算「加」(
+ + + )和「乘」(
⋅ \cdot ⋅ )的集合
R R R (注意不要与实数集
R \mathbb R R 混淆),满足:
加法封闭性:∀ x , y ∈ R : x + y ∈ R \forall x,y\in R:x+y\in R ∀ x , y ∈ R : x + y ∈ R ;
加法结合律:∀ x , y , z ∈ R : ( x + y ) + z = x + ( y + z ) \forall x,y,z\in R:(x+y)+z=x+(y+z) ∀ x , y , z ∈ R : ( x + y ) + z = x + ( y + z ) ;
加法单位元(有时简称为「零元」)存在:∃ 0 ∈ R : ∀ x ∈ R : 0 + x = x \exists 0\in R:\forall x\in R:0+x=x ∃0 ∈ R : ∀ x ∈ R : 0 + x = x ;
加法逆元存在:∀ x ∈ R : ∃ − x ∈ R : x + ( − x ) = 0 \forall x\in R:\exists{-x}\in R:x+(-x)=0 ∀ x ∈ R : ∃ − x ∈ R : x + ( − x ) = 0 ;
加法交换律:∀ x , y ∈ R : x + y = y + x \forall x,y\in R:x+y=y+x ∀ x , y ∈ R : x + y = y + x ;
乘法封闭性:∀ x , y ∈ R : x y ∈ R \forall x,y\in R:xy\in R ∀ x , y ∈ R : x y ∈ R ;
乘法结合律:∀ x , y , z ∈ R : ( x y ) z = x ( y z ) \forall x,y,z\in R:(xy)z=x(yz) ∀ x , y , z ∈ R : ( x y ) z = x ( yz ) ;
乘法对加法的分配律:∀ x , y , z ∈ R : x ( y + z ) = x y + x z , ( y + z ) x = y x + z x \forall x,y,z\in R:x(y+z)=xy+xz,(y+z)x=yx+zx ∀ x , y , z ∈ R : x ( y + z ) = x y + x z , ( y + z ) x = y x + z x 。
乘法不一定具有交换律。定义一个数对
( a , b , c , d ) (a,b,c,d) ( a , b , c , d ) ,他们之间的乘法定义为
( a , b , c , d ) ( e , f , g , h ) : = ( a e + b g , a f + b h , c e + d g , c f + d h ) (a,b,c,d)(e,f,g,h):=(ae+bg,af+bh,ce+dg,cf+dh) ( a , b , c , d ) ( e , f , g , h ) := ( a e + b g , a f + bh , ce + d g , c f + d h ) ,则
( 0 , 1 , 0 , 0 ) ( 0 , 0 , 1 , 0 ) = ( 1 , 0 , 0 , 0 ) , ( 0 , 0 , 1 , 0 ) ( 0 , 1 , 0 , 0 ) = ( 0 , 0 , 0 , 1 ) (0,1,0,0)(0,0,1,0)=(1,0,0,0),(0,0,1,0)(0,1,0,0)=(0,0,0,1) ( 0 , 1 , 0 , 0 ) ( 0 , 0 , 1 , 0 ) = ( 1 , 0 , 0 , 0 ) , ( 0 , 0 , 1 , 0 ) ( 0 , 1 , 0 , 0 ) = ( 0 , 0 , 0 , 1 ) 。
定义 2:如果环
I , R I,R I , R 满足
I ⊆ R I\subseteq R I ⊆ R ,则称
I I I 是
R R R 的「子环」。
定义 3:
R [ i ] R[i] R [ i ] 是在不改变加法与乘法运算时最小的包含了
R R R 中所有元素和元素
i i i 的环。
例如,
R [ − 1 ] = C \mathbb R[\sqrt{-1}]=\mathbb C R [ − 1 ] = C 。
定义 4:「交换环」是额外满足
∀ x , y ∈ R : x y = y x \forall x,y\in R:xy=yx ∀ x , y ∈ R : x y = y x 的环
R R R 。
定义 5:如果
∃ 1 ∈ R : ∀ x ∈ R : 1 x = x \exists 1\in R:\forall x\in R:1x=x ∃1 ∈ R : ∀ x ∈ R : 1 x = x ,那么
R R R 被称作「幺环」,
1 1 1 被称作「幺元」或「乘法单位元」。
偶数环
( { x ∣ x ≡ 0 ( m o d 2 ) } , + , ⋅ ) (\{x\mid x\equiv0\pmod2\},+,\cdot) ({ x ∣ x ≡ 0 ( mod 2 )} , + , ⋅ ) 没有幺元。
定义 6:「整环」是额外满足
∀ a , b ∈ R ∖ { 0 } : a b ≠ 0 \forall a,b\in R\setminus{\{0\}}:ab\neq 0 ∀ a , b ∈ R ∖ { 0 } : ab = 0 的幺交换环
R R R 。
并非所有幺交换环都是整环,例如模
6 6 6 意义整数环
( { 0 , 1 , 2 , 3 , 4 , 5 } , ( x + y ) m o d 6 , x y m o d 6 ) (\{0,1,2,3,4,5\},(x+y)\bmod6, xy\bmod 6) ({ 0 , 1 , 2 , 3 , 4 , 5 } , ( x + y ) mod 6 , x y mod 6 ) 中,有
2 × 3 ≡ 0 ( m o d 6 ) 2\times 3\equiv0\pmod 6 2 × 3 ≡ 0 ( mod 6 ) 。
定义 7:如果对于幺环
R R R 和
x ∈ R x\in R x ∈ R ,满足
∃ y ∈ R : x y = 1 \exists y\in R:xy=1 ∃ y ∈ R : x y = 1 ,则称
x x x 是一个
R R R 中的「可逆元(unit)」。
Z \mathbb Z Z 只有
± 1 \pm1 ± 1 两个可逆元。
定义 8:在整环
R R R 中满足
p ≠ 0 , ∀ p ∣ a b : p ∣ a ∨ p ∣ b p\neq 0,\forall p\mid ab:p\mid a\lor p\mid b p = 0 , ∀ p ∣ ab : p ∣ a ∨ p ∣ b 的元素
p p p 称作「素元」。
定义 9:在整环
R R R 中满足
∃ a , b not unit : a b = r \exists a,b\text{ not unit}:ab=r ∃ a , b not unit : ab = r 的元素
r r r 是「可约元」,否则是「不可约元」。
不可约不一定就是素元,例如在
Z [ − 5 ] \mathbb Z[\sqrt{-5}] Z [ − 5 ] 中,
3 3 3 不可约且
3 ∣ ( 1 + − 5 ) ( 1 − − 5 ) = 1 2 − ( − 5 ) 2 = 6 3\mid(1+\sqrt{-5})(1-\sqrt{-5})=1^2-(\sqrt{-5})^2=6 3 ∣ ( 1 + − 5 ) ( 1 − − 5 ) = 1 2 − ( − 5 ) 2 = 6 ,所以
3 3 3 不是素元。
引理 1(整环上的乘法消去律):整环
R R R 满足
∀ a ≠ 0 , a b = a c : b = c \forall a\neq 0,ab=ac:b=c ∀ a = 0 , ab = a c : b = c 。
证:
a b − a c = 0 ⇒ a ( b − c ) = 0 ab-ac=0\Rightarrow a(b-c)=0 ab − a c = 0 ⇒ a ( b − c ) = 0 ,是整环,
a a a 又不是
0 0 0 ,只能
b − c = 0 ⇒ b = c b-c=0\Rightarrow b=c b − c = 0 ⇒ b = c 。
理想
定义 10:对于环
R R R 和其上的元素
x x x ,定义运算
x R : = { x r ∣ r ∈ R } , R x : = { r x ∣ r ∈ R } xR:=\{xr\mid r\in R\},Rx:=\{rx\mid r\in R\} x R := { x r ∣ r ∈ R } , R x := { r x ∣ r ∈ R } 。
定义 11:如果对于
R R R 的子环
I I I ,有
∀ x ∈ R : x I ⊆ I \forall x\in R:xI\subseteq I ∀ x ∈ R : x I ⊆ I ,则称
I I I 是
R R R 的一个「左理想」;如果
∀ x ∈ R : I x ⊆ I \forall x\in R:Ix\subseteq I ∀ x ∈ R : I x ⊆ I ,则是「右理想」;如果
I I I 既是左理想又是右理想,那么他就是
R R R 的一个「理想(ideal)」。
引理 2:两个理想的交仍然是理想。
证:
环的封闭性显然,因为
x , y ∈ I , x , y ∈ J x,y\in I,x,y\in J x , y ∈ I , x , y ∈ J 必然有
x y ∈ I , x y ∈ J xy\in I,xy\in J x y ∈ I , x y ∈ J ,从而
x y ∈ I ∩ J xy\in I\cap J x y ∈ I ∩ J ,各种运算律也随之满足。至于为什么
r ( I ∩ J ) , ( I ∩ J ) r ⊆ ( I ∩ J ) r(I\cap J),(I\cap J)r\subseteq(I\cap J) r ( I ∩ J ) , ( I ∩ J ) r ⊆ ( I ∩ J )
∀ x ∈ I ∩ J , r ∈ R : x ∈ I , x ∈ J ⇒ r x , x r ∈ I , J ⇒ r x , x r ∈ I ∩ J \forall x\in I\cap J,r\in R:x\in I,x\in J\\
\Rightarrow rx,xr\in I,J\\
\Rightarrow rx,xr\in I\cap J ∀ x ∈ I ∩ J , r ∈ R : x ∈ I , x ∈ J ⇒ r x , x r ∈ I , J ⇒ r x , x r ∈ I ∩ J
定义 12:理想间的运算
I + J : = { i + j ∣ i ∈ I , j ∈ J } I J : = { ∑ k = 1 n i k j k ∣ n ∈ N , i k ∈ I , j k ∈ J } I+J:=\{i+j\mid i\in I,j\in J\}\\
IJ:=\left\{\sum_{k=1}^ni_kj_k\mid n\in\N,i_k\in I,j_k\in J\right\} I + J := { i + j ∣ i ∈ I , j ∈ J } I J := { k = 1 ∑ n i k j k ∣ n ∈ N , i k ∈ I , j k ∈ J }
引理 3:理想的运算结果是理想。
证:对于加法,设
i 1 , i 2 ∈ I , j 1 , j 2 ∈ J , r ∈ R a = i 1 + j 1 , b = i 2 + j 2 ∈ I + J i_1,i_2\in I,j_1,j_2\in J,r\in R\\
a=i_1+j_1,b=i_2+j_2\in I+J i 1 , i 2 ∈ I , j 1 , j 2 ∈ J , r ∈ R a = i 1 + j 1 , b = i 2 + j 2 ∈ I + J
则有
a + b = ( i 1 + i 2 ) + ( j 1 + j 2 ) ∈ I + J r a = r i 1 + r j 1 ∈ I + J a+b=(i_1+i_2)+(j_1+j_2)\in I+J\\
ra=ri_1+rj_1\in I+J a + b = ( i 1 + i 2 ) + ( j 1 + j 2 ) ∈ I + J r a = r i 1 + r j 1 ∈ I + J
对于乘法,设
i k , i ′ k ∈ I , j k , j ′ k ∈ J , r ∈ R a = ∑ k = 1 n i k j k , b = ∑ k = 1 m i ′ k j ′ k i_k,{i'}_k\in I,j_k,{j'}_k\in J,r\in R\\
a=\sum_{k=1}^ni_kj_k,b=\sum_{k=1}^m{i'}_k{j'}_k i k , i ′ k ∈ I , j k , j ′ k ∈ J , r ∈ R a = k = 1 ∑ n i k j k , b = k = 1 ∑ m i ′ k j ′ k
则有
a + b = ∑ k = 1 n i k j k + ∑ k = 1 m i ′ k j ′ k r a = ∑ k = 1 n ( r i k ) j k ∈ I J a+b=\sum_{k=1}^ni_kj_k+\sum_{k=1}^m{i'}_k{j'}_k\\
ra=\sum_{k=1}^n(ri_k)j_k\in IJ a + b = k = 1 ∑ n i k j k + k = 1 ∑ m i ′ k j ′ k r a = k = 1 ∑ n ( r i k ) j k ∈ I J
定义 13:如果理想
I I I 和集合
A A A 满足
A ⊆ I A\subseteq I A ⊆ I 以及
∀ ideal J ⊇ A : I ⊆ J \forall\text{ ideal }J\supseteq A:I\subseteq J ∀ ideal J ⊇ A : I ⊆ J ,则
I I I 称为「
A A A 在
R R R 中的的生成理想」,记作
( A ) (A) ( A ) 。
存在性证明:首先,
R R R 肯定是一个包含
A A A 的理想。然后,如果理想
I , J ⊇ A I,J\supseteq A I , J ⊇ A 互不包含,那么
I ∩ J I\cap J I ∩ J 一定包含
A A A 且是理想。
定义 14:如果
A = { a } A=\{a\} A = { a } ,那么
( A ) (A) ( A ) 就是一个「主理想」,也记作
( a ) (a) ( a ) 。
a a a 被称作
( a ) (a) ( a ) 的「生成元」。
环
R [ x 1 , x 2 ] \mathbb R[x_1,x_2] R [ x 1 , x 2 ] (变量有
x 1 x_1 x 1 和
x 2 x_2 x 2 的所有多项式组成的环)自身不是主理想。
商环
定义 15:对于元素
a ∈ R a\in R a ∈ R 和理想
I I I ,定义
a + I : = { a + i ∣ i ∈ I } , R / I : = { a + I : a ∈ R } a+I:=\{a+i\mid i\in I\},R/I:=\{a+I:a\in R\} a + I := { a + i ∣ i ∈ I } , R / I := { a + I : a ∈ R } 。
注意
R / I R/I R / I 是一个集合的集,例如令
m i : = { x ∣ x ≡ i ( m o d 6 ) } m_i:=\{x\mid x\equiv i\pmod 6\} m i := { x ∣ x ≡ i ( mod 6 )} ,则
N / 6 N \N/6\N N /6 N 代表
{ m 0 , m 1 , m 2 , m 3 , m 4 , m 5 } \{m_0,m_1,m_2,m_3,m_4,m_5\} { m 0 , m 1 , m 2 , m 3 , m 4 , m 5 } 。
引理 4:
( a + I ) + ( b + I ) = ( a + b ) + I , ( a + I ) ( b + I ) = ( a b ) + I (a+I)+(b+I)=(a+b)+I,(a+I)(b+I)=(ab)+I ( a + I ) + ( b + I ) = ( a + b ) + I , ( a + I ) ( b + I ) = ( ab ) + I 。
证:
( a + I ) + ( b + I ) = { ( a + b + i + j ) ∣ i , j ∈ I } = ( a + b ) + I ( a + I ) ( b + I ) = { ∑ k = 1 n i k j k ∣ i k ∈ a + I , j k ∈ b + I } = { ∑ k = 1 n ( a + i k ) ( b + j k ) ∣ i k , j k ∈ I } = { ∑ k = 1 n a b + a i k + b j k + i k j + k ∣ i k , j k ∈ I } = a i k , b j k , i k j k ∈ I ( a b ) I \begin{aligned}
(a+I)+(b+I)=&\{(a+b+i+j)\mid i,j\in I\}\\
=&(a+b)+I\\
(a+I)(b+I)=&\{\sum_{k=1}^ni_kj_k\mid i_k\in a+I,j_k\in b+I\}\\
=&\{\sum_{k=1}^n(a+i_k)(b+j_k)\mid i_k,j_k\in I\}\\
=&\{\sum_{k=1}^nab+ai_k+bj_k+i_kj+k\mid i_k,j_k\in I\}\\
\xlongequal{ai_k,bj_k,i_kj_k\in I}&(ab)I
\end{aligned} ( a + I ) + ( b + I ) = = ( a + I ) ( b + I ) = = = a i k , b j k , i k j k ∈ I {( a + b + i + j ) ∣ i , j ∈ I } ( a + b ) + I { k = 1 ∑ n i k j k ∣ i k ∈ a + I , j k ∈ b + I } { k = 1 ∑ n ( a + i k ) ( b + j k ) ∣ i k , j k ∈ I } { k = 1 ∑ n ab + a i k + b j k + i k j + k ∣ i k , j k ∈ I } ( ab ) I
本文中最常用的商环是模
p p p 意义下整数环
Z / p Z \Z/p\Z Z / p Z 。用环的语言,
a + b ≡ c ( m o d p ) a+b\equiv c\pmod p a + b ≡ c ( mod p ) 应该写成
( a + Z / p Z ) + ( b + Z / p Z ) = c + Z / p Z (a+\Z/p\Z)+(b+\Z/p\Z)=c+\Z/p\Z ( a + Z / p Z ) + ( b + Z / p Z ) = c + Z / p Z ,
a b ≡ d ( m o d p ) ab\equiv d\pmod p ab ≡ d ( mod p ) 应该写成
( a + Z / p Z ) ( b + Z / p Z ) = d + Z / p Z (a+\Z/p\Z)(b+\Z/p\Z)=d+\Z/p\Z ( a + Z / p Z ) ( b + Z / p Z ) = d + Z / p Z 。
整除
定义 16:如果对于交换环
R R R 和
a , b ∈ R a,b\in R a , b ∈ R ,满足
∃ x ∈ R : b x = a \exists x\in R:bx=a ∃ x ∈ R : b x = a ,则称
b b b 是
a a a 的「因子」,
b b b 「整除」
a a a ,记作
b ∣ a b\mid a b ∣ a 。
定义 17:如果对于交换环
R R R 上的元素
a , b a,b a , b 和可逆元
u u u ,满足
a u = b au=b a u = b ,那么称
a a a 和
b b b 「相伴」。
Z \mathbb Z Z 中
2 2 2 和
− 2 -2 − 2 相伴。
定义 18:如果对于交换环
R R R 和他的元素
a , b a,b a , b ,满足:
∃ d : d ∣ a , d ∣ b ∀ d ′ ∣ a , d ′ ∣ b : d ′ ∣ d \exists d:d\mid a,d\mid b\\
\forall d'\mid a,d'\mid b:d'\mid d ∃ d : d ∣ a , d ∣ b ∀ d ′ ∣ a , d ′ ∣ b : d ′ ∣ d
则称
d d d 是
a , b a,b a , b 的「最大公因数」,记作
gcd ( a , b ) \gcd(a,b) g cd( a , b ) 。
他可能不存在,但是一定在相伴意义下唯一,因为如果有
d , d ′ d,d' d , d ′ 满足条件,则
d ∣ d ′ ∣ d d\mid d'\mid d d ∣ d ′ ∣ d 。
引理 5:整环上的素元都是不可约元。
证:对于素元
r r r ,考虑当
r = a b r=ab r = ab 时证明
a a a 或
b b b 可逆。由
r ∣ a b r\mid ab r ∣ ab 和素元的定义得
r ∣ a ∨ r ∣ b r\mid a\lor r\mid b r ∣ a ∨ r ∣ b ,不妨设
r ∣ a r\mid a r ∣ a 。令
a = c r a=cr a = cr ,则
r = a b = c r b ⇒ c b = 1 r=ab=crb\Rightarrow cb=1 r = ab = cr b ⇒ c b = 1 ,故
b b b 可逆。
Euclid 整环
定义 19:如果对于整环
R R R ,存在映射
N : R → N N:R\to\N N : R → N 使得
N ( 0 ) = 0 N(0)=0 N ( 0 ) = 0 且
∀ a , b ∈ R : ∃ q , r ∈ R : a = b q + r , N ( r ) < N ( b ) \forall a,b\in R:\exists q,r\in R:a=bq+r,N(r)<N(b) ∀ a , b ∈ R : ∃ q , r ∈ R : a = b q + r , N ( r ) < N ( b ) ,则
R R R 是一个「Euclid 整环」,映射
N N N 被叫做
R R R 的「范数」。
范数不一定唯一,例如在
N \N N 中可以设
N ( x ) = x N(x)=x N ( x ) = x 和
N ( x ) = 2 x N(x)=2x N ( x ) = 2 x 。
引理 6:在 Euclid 整环上可以使用辗转相除法求得
gcd ( a , b ) \gcd(a,b) g cd( a , b ) ,且
∀ a , b , x , y : gcd ( a , b ) ∣ a x + b y \forall a,b,x,y:\gcd(a,b)\mid ax+by ∀ a , b , x , y : g cd( a , b ) ∣ a x + b y 。
证明与整数上的辗转相除法正确性和 Bezout 定理类似。
主理想整环
定义 20:如果对于整环
R R R ,他的每个理想
I I I 都是主理想,那么
R R R 是一个「主理想整环」。
引理 7:Euclid 整环都是主理想整环。
证:取理想
I I I 上范数最小的非
0 0 0 元素
d d d ,那么所有
a ∈ I a\in I a ∈ I 满足
a = q d + r a=qd+r a = q d + r ,由
N ( r ) < N ( d ) N(r)<N(d) N ( r ) < N ( d ) 得
r = 0 r=0 r = 0 ,故
∀ a ∈ I : ∃ q ∈ I : a = q d \forall a\in I:\exists q\in I:a=qd ∀ a ∈ I : ∃ q ∈ I : a = q d ,故
a ∈ ( d ) ⇒ I ⊆ ( d ) a\in(d)\Rightarrow I\subseteq(d) a ∈ ( d ) ⇒ I ⊆ ( d ) ,根据生成理想的定义得
I = ( d ) I=(d) I = ( d ) 。
引理 8:主理想整环中的素元和不可约元等价。
引理 5 已经证了一半了,下证不可约元都是素元。
设不可约元
p p p 满足
p ∣ a b p\mid ab p ∣ ab ,需要证明
p ∣ a ∨ p ∣ b p\mid a\lor p\mid b p ∣ a ∨ p ∣ b 。考虑理想:
I : = ( p , a ) = { p i + a j ∣ i , j ∈ R } I:=(p,a)=\{pi+aj\mid i,j\in R\} I := ( p , a ) = { p i + aj ∣ i , j ∈ R }
因为是主理想整环,所以
∃ d : ( d ) = I \exists d:(d)=I ∃ d : ( d ) = I 。由
p ∈ I p\in I p ∈ I 和
{ x d ∣ x ∈ R } = ( d ) \{xd\mid x\in R\}=(d) { x d ∣ x ∈ R } = ( d ) 得
d ∣ p d\mid p d ∣ p ,此时要么
d , p d,p d , p 相伴,要么
d d d 是可逆元。
d , p d,p d , p 相伴时,存在可逆元
u u u 满足
u d = p ud=p u d = p ,从而
I = ( d ) = ( u d ) = ( p ) a ∈ ( p ) p ∣ a I=(d)=(ud)=(p)\\
a\in(p)\\
p\mid a I = ( d ) = ( u d ) = ( p ) a ∈ ( p ) p ∣ a
∃ u : u d = 1 1 ∈ I ∃ i , j ∈ R : p i + a j = 1 b = p i b + a j b p ∣ a b ⇒ p ∣ a j b ⇒ p ∣ ( p i b + a j b ) ⇒ p ∣ b \exists u:ud=1\\
1\in I\\
\exists i,j\in R:pi+aj=1\\
b=pib+ajb\\
p\mid ab\Rightarrow p\mid ajb\Rightarrow p\mid(pib+ajb)\Rightarrow p\mid b ∃ u : u d = 1 1 ∈ I ∃ i , j ∈ R : p i + aj = 1 b = p ib + ajb p ∣ ab ⇒ p ∣ ajb ⇒ p ∣ ( p ib + ajb ) ⇒ p ∣ b
证毕。
唯一分解整环
定义 21:如果
R R R 中的非零不可逆元
r r r 都能写成
∏ i = 1 n p i \prod_{i=1}^np_i ∏ i = 1 n p i ,其中
p i p_i p i 是不可约不可逆元,且
{ p n } \{p_n\} { p n } 在重排和相伴意义下唯一,则称
R R R 是「唯一分解整环」。
引理 9:唯一分解整环中不可约元和素元等价。
证:对于不可约元
r r r 和
r ∣ a b r\mid ab r ∣ ab ,将
a b ab ab 进行分解,
r r r 必和其中一个因子相伴,不妨设他可能来自于
a a a (即他一定是
a a a 的因子,可能是
b b b 的因子),则
r ∣ a r\mid a r ∣ a ,故
r r r 是素元。
引理 10:主理想整环都是唯一分解整环。
证:
如果
r r r 是不可约元,那么不必继续分解;否则对满足
r = r 1 r 2 r=r_1r_2 r = r 1 r 2 的非可逆元
r 1 , r 2 r_1,r_2 r 1 , r 2 继续分解。如果分解不停止,无限进行,那么存在一个序列
{ r ∞ } \{r_\infty\} { r ∞ } 满足
r 0 = r , r i + 1 ∣ r r_0=r,r_{i+1}\mid r r 0 = r , r i + 1 ∣ r ,且序列中相邻的数两两不相伴。考虑他们生成的理想
I i : = ( r i ) I_i:=(r_i) I i := ( r i ) ,则
I i ⊂ I i + 1 , I i ⊆ R I_i\subset I_{i+1},I_i\subseteq R I i ⊂ I i + 1 , I i ⊆ R 。令
I : = ⋃ i = 0 ∞ I i I:=\bigcup_{i=0}^\infty I_i I := ⋃ i = 0 ∞ I i ,则
I I I 是理想(
∀ a , b ∈ I : ∃ n ∈ N : a , b ∈ I n \forall a,b\in I:\exists n\in\N:a,b\in I_n ∀ a , b ∈ I : ∃ n ∈ N : a , b ∈ I n ),从而
I I I 是主理想。令其生成元为
d d d ,则
∃ n ∈ N : d ∈ I n \exists n\in\N:d\in I_n ∃ n ∈ N : d ∈ I n ,从而
I ⊆ I n I\subseteq I_n I ⊆ I n ,矛盾。
如果
r r r 有
∏ i = 1 n p i = ∏ i = 1 m q i = r \prod_{i=1}^np_i=\prod_{i=1}^mq_i=r ∏ i = 1 n p i = ∏ i = 1 m q i = r ,那么对于不可约元
p 1 p_1 p 1 ,一定存在
p 1 ∣ q i p_1\mid q_i p 1 ∣ q i ,因为
q i q_i q i 也是不可约元,所以他俩相伴,从两个序列里踢出去。以此类推,知道其中一个序列为空,另一个如果不为空,则里面的乘积为
1 1 1 ,因此都是可逆元,不符合定义;如果为空,就说明
n = m n=m n = m ,恰恰证明了两个序列在重排和相伴的意义下唯一。
引理 11:唯一分解整环中任两个元素的最大公约数存在。
对于可逆元
u 1 , u 2 u_1,u_2 u 1 , u 2 和唯一分解整环上的数
r 1 = u 1 ∏ i = 1 n p i α i , r 2 = u 2 ∏ i = 1 n p i β i r_1=u_1\prod_{i=1}^n{p_i}^{\alpha_i},r_2=u_2\prod_{i=1}^n{p_i}^{\beta_i} r 1 = u 1 ∏ i = 1 n p i α i , r 2 = u 2 ∏ i = 1 n p i β i ,有
gcd ( r 1 , r 2 ) = ∏ i = 1 n p i min ( α i , β i ) \gcd(r_1,r_2)=\prod_{i=1}^n{p_i}^{\min(\alpha_i,\beta_i)} g cd( r 1 , r 2 ) = ∏ i = 1 n p i m i n ( α i , β i ) 在相伴意义下唯一且存在。
【前置知识】二次剩余
给
a , p a,p a , p ,解方程
x 2 ≡ a ( m o d p ) x^2\equiv a\pmod p x 2 ≡ a ( mod p ) 。
p = 2 p=2 p = 2 时过于简单,所以我们默认
p p p 为奇质数。
定义 1:如果该方程有解,就称
a a a 是「
p p p 的二次剩余(quadratic residue)」;否则,称
a a a 是「
p p p 的二次非剩余(quadratic non-residue)」。
定义 2:Legendre 符号(为方便,省略
i ( m o d p ) i\pmod p i ( mod p ) ):
( a p ) : = { 0 , a ≡ 0 1 , a ≢ 0 , a is a quadratic residue − 1 , otherwise . \left(\frac ap\right):=
\begin{aligned}\begin{cases}
0,\quad&a\equiv0\\
1,\quad&a\not\equiv0,a\text{ is a quadratic residue}\\
-1,\quad&\text{otherwise}.
\end{cases}\end{aligned} ( p a ) := ⎩ ⎨ ⎧ 0 , 1 , − 1 , a ≡ 0 a ≡ 0 , a is a quadratic residue otherwise .
引理 1:
( a p ) ≡ a p − 1 2 \left(\frac ap\right)\equiv a^{\frac{p-1}2} ( p a ) ≡ a 2 p − 1 。
证明:
如果 a ≡ 0 a\equiv 0 a ≡ 0 ,那么两边都是 0 0 0 ;
否则,如果 a a a 是二次剩余,那么 a p − 1 2 ≡ a p − 1 ≡ 1 a^{\frac{p-1}2}\equiv{\sqrt a}^{p-1}\equiv 1 a 2 p − 1 ≡ a p − 1 ≡ 1 ;
否则,令 r ( i ) : = a i − 1 r(i):=ai^{-1} r ( i ) := a i − 1 ,那么
r ( i ) ≠ i r − 1 = r a p − 1 2 ≡ ∏ i ∈ [ 1 , p ) , i < r ( i ) i r ( i ) ≡ ( p − 1 ) ! ≡ Wilson’s Theorem − 1 r(i)\neq i\\
r^{-1}=r\\
\begin{aligned}
a^{\frac{p-1}2}\equiv&\prod_{i\in[1,p),i<r(i)}ir(i)\\
\equiv&(p-1)!\\
\overset{\text{Wilson's Theorem}}{\equiv}&{-1}
\end{aligned} r ( i ) = i r − 1 = r a 2 p − 1 ≡ ≡ ≡ Wilson’s Theorem i ∈ [ 1 , p ) , i < r ( i ) ∏ i r ( i ) ( p − 1 )! − 1
引理 2:
[ 1 , p ) [1,p) [ 1 , p ) 内(若无特殊说明,本节内所有数都在
[ 1 , p ) [1,p) [ 1 , p ) 内)恰有
p − 1 2 \frac{p-1}2 2 p − 1 个二次剩余。
证明:
试证
∣ { ( x 2 m o d p ) ∣ x } ∣ = p − 1 2 \left\lvert\{(x^2\bmod p)\mid x\}\right\rvert=\frac{p-1}2 {( x 2 mod p ) ∣ x } = 2 p − 1 。考虑一个更强的结论:
∀ x : ∃ ! ∗ y : x 2 ≡ y 2 \forall x:\exist!^*y:x^2\equiv y^2 ∀ x : ∃ ! ∗ y : x 2 ≡ y 2 。这相当于
( x + y ) ( x − y ) ≡ 0 (x+y)(x-y)\equiv 0 ( x + y ) ( x − y ) ≡ 0 ,由于
x ≠ y x\neq y x = y ,所以
x + y ≡ 0 , y ≡ − x x+y\equiv 0,y\equiv-x x + y ≡ 0 , y ≡ − x 。
接下来,我们需要将环
Z / p Z \Z/p\Z Z / p Z 扩展至
Z / p Z [ t ] \Z/p\Z[\sqrt t] Z / p Z [ t ] ,其中
t t t 是任意非二次剩余。
定义 3:对所有
z = x + y t ∈ Z / p Z [ t ] z=x+y\sqrt t\in \Z/p\Z[\sqrt t] z = x + y t ∈ Z / p Z [ t ] ,定义
ℜ ( z ) : = x , ℑ ( z ) : = y \Re(z):=x,\Im(z):=y ℜ ( z ) := x , ℑ ( z ) := y 。
定理 1:
∀ u , t = u 2 − a : ( t p ) = − 1 ⇒ ( u + t ) p + 1 ≡ a \forall u,t=u^2-a:\left(\frac tp\right)=-1\Rightarrow(u+\sqrt t)^{p+1}\equiv a ∀ u , t = u 2 − a : ( p t ) = − 1 ⇒ ( u + t ) p + 1 ≡ a 。
( u + t ) p + 1 = ( u + t ) ∑ i = 0 p ( p i ) u i t p − i ≡ ( u + t ) ( u p + t p ) ≡ ( u + t ) ( u + t ( t 2 ) p − 1 2 ) ≡ ( u + t ) ( u + t ⋅ t p − 1 2 ) ≡ ( u + t ) ( u − t ) ≡ u 2 − t ≡ a \begin{aligned}
(u+\sqrt t)^{p+1}=&(u+\sqrt t)\sum_{i=0}^p\binom piu^i\sqrt t^{p-i}\\
\equiv&(u+\sqrt t)\left(u^p+\sqrt t^p\right)\\
\equiv&(u+\sqrt t)\left(u+\sqrt t\left(\sqrt t^2\right)^{\frac{p-1}2}\right)\\
\equiv&(u+\sqrt t)\left(u+\sqrt t\cdot t^{\frac{p-1}2}\right)\\
\equiv&(u+\sqrt t)(u-\sqrt t)\\
\equiv&u^2-t\\
\equiv&a
\end{aligned} ( u + t ) p + 1 = ≡ ≡ ≡ ≡ ≡ ≡ ( u + t ) i = 0 ∑ p ( i p ) u i t p − i ( u + t ) ( u p + t p ) ( u + t ) ( u + t ( t 2 ) 2 p − 1 ) ( u + t ) ( u + t ⋅ t 2 p − 1 ) ( u + t ) ( u − t ) u 2 − t a
定理 2:
∀ u , t = u 2 − a , ( t p ) = − 1 : ℑ ( ( u + t ) p + 1 2 ) ≡ 0 , ℜ ( ( u + t ) p + 1 2 ) 2 ≡ a \forall u,t=u^2-a,\left(\frac tp\right)=-1:\Im\left((u+\sqrt t)^{\frac{p+1}2}\right)\equiv0,\Re\left((u+\sqrt t)^{\frac{p+1}2}\right)^2\equiv a ∀ u , t = u 2 − a , ( p t ) = − 1 : ℑ ( ( u + t ) 2 p + 1 ) ≡ 0 , ℜ ( ( u + t ) 2 p + 1 ) 2 ≡ a 。
证明:
如果存在
A , B A,B A , B 满足
B ≢ 0 , ( A + B t ) 2 ≡ a B\not\equiv0,(A+B\sqrt t)^2\equiv a B ≡ 0 , ( A + B t ) 2 ≡ a ,那么
A 2 + t B 2 + 2 A B t ≡ a A^2+tB^2+2AB\sqrt t\equiv a A 2 + t B 2 + 2 A B t ≡ a ,从而
2 A B ≡ 0 ⇒ A ≡ 0 ⇒ B 2 t ≡ a 2AB\equiv0\Rightarrow A\equiv 0\Rightarrow B^2t\equiv a 2 A B ≡ 0 ⇒ A ≡ 0 ⇒ B 2 t ≡ a 。但是
( t p ) ( B 2 p ) = − 1 × 1 ≠ 1 = ( a p ) \left(\frac tp\right)\left(\frac{B^2}p\right)=-1\times1\neq1=\left(\frac ap\right) ( p t ) ( p B 2 ) = − 1 × 1 = 1 = ( p a ) ,矛盾。故
ℑ ( ( u + t ) p + 1 2 ) ≡ 0 \Im\left((u+\sqrt t)^{\frac{p+1}2}\right)\equiv0 ℑ ( ( u + t ) 2 p + 1 ) ≡ 0 得证,结合引理 3 可得
ℜ ( ( u + t ) p + 1 2 ) 2 ≡ a \Re\left((u+\sqrt t)^{\frac{p+1}2}\right)^2\equiv a ℜ ( ( u + t ) 2 p + 1 ) 2 ≡ a 。
推论:
ℜ ( ( u + t ) p + 1 2 ) \Re\left((u+\sqrt t)^{\frac{p+1}2}\right) ℜ ( ( u + t ) 2 p + 1 ) 是方程
x 2 ≡ a x^2\equiv a x 2 ≡ a 的一个解。
Cipolla
~(∠・ω< )⌒★ 算法:随机选取
u u u 直至
( t p ) = − 1 \left(\frac tp\right)=-1 ( p t ) = − 1 (期望
2 2 2 次),利用快速幂求出
ℜ ( ( u + t ) p + 1 2 ) \Re\left((u+\sqrt t)^{\frac{p+1}2}\right) ℜ ( ( u + t ) 2 p + 1 ) ,从而在
O ( log p ) \Omicron(\log p) O ( log p ) 的时间内求解二次同余方程
x 2 ≡ a x^2\equiv a x 2 ≡ a 。
【前置知识】行列式
如果你对证明不感兴趣,可以跳过这一章节。
定义 1:对一个集合
T T T ,他的「全排列」指集合
{ sequence a ∣ ∀ i ∈ T : i ∈ a , ∀ i ∈ a : i ∈ T , ∣ a ∣ = ∣ T ∣ } \{\text{sequence }a\mid\forall i\in T:i\in a,\forall i\in a:i\in T, |a|=|T|\} { sequence a ∣ ∀ i ∈ T : i ∈ a , ∀ i ∈ a : i ∈ T , ∣ a ∣ = ∣ T ∣ }
记作
P e r m ( T ) \mathrm{Perm}(T) Perm ( T ) 。「
n n n 阶置换集」
S n S_n S n 定义为
P e r m ( [ 1 , n ] ) \mathrm{Perm}([1,n]) Perm ([ 1 , n ]) 。
S n S_n S n 中的元素称作「
n n n 阶置换」。一个
n n n 阶置换
σ − 1 \sigma^{-1} σ − 1 是
σ \sigma σ 的「逆置换」,当且仅当
∀ i : σ − 1 σ i = i \forall i:{\sigma^{-1}}_{\sigma_i}=i ∀ i : σ − 1 σ i = i 。显然他是唯一存在的。
定义 2:对于一个排列
σ \sigma σ ,定义他的「逆序对数」
i n v ( σ ) : = ∑ i < j [ σ i > σ j ] \mathrm{inv}(\sigma):=\sum_{i<j}[\sigma_i>\sigma_j] inv ( σ ) := ∑ i < j [ σ i > σ j ] ,定义他的「符号」
s g n ( σ ) : = ( − 1 ) i n v ( σ ) \mathrm{sgn}(\sigma):=(-1)^{\mathrm{inv}(\sigma)} sgn ( σ ) := ( − 1 ) inv ( σ ) 。
引理 1:对于一个排列
τ ∈ P e r m ( [ 1 , n ] ∖ { j } ) \tau\in\mathrm{Perm}([1,n]\setminus\{j\}) τ ∈ Perm ([ 1 , n ] ∖ { j }) ,如果有
σ ∈ S n \sigma\in S_n σ ∈ S n 满足
σ = [ τ 1 , τ 2 , … , τ I − 1 , j , τ I , … , τ n − 1 ] \sigma=[\tau_1,\tau_2,\dots,\tau_{I-1},j,\tau_I,\dots,\tau_{n-1}] σ = [ τ 1 , τ 2 , … , τ I − 1 , j , τ I , … , τ n − 1 ]
即
σ \sigma σ 是
τ \tau τ 在第
I I I 个位置插入
j j j 所得的
n n n 阶置换,那么
i n v ( σ ) − i n v ( τ ) ≡ I − j ( m o d 2 ) \mathrm{inv}(\sigma)-\mathrm{inv}(\tau)\equiv I-j\pmod 2 inv ( σ ) − inv ( τ ) ≡ I − j ( mod 2 ) 。
原本的,
j j j 在
j j j 位置,左边有多少个比
j j j 大,右边就有多少个比
j j j 小,
j j j 对逆序对奇偶性贡献为
0 0 0 。
j j j 每移动一格,就会对逆序对造成一个
± 1 \pm1 ± 1 的贡献,移动
∣ I − j ∣ \lvert I-j\rvert ∣ I − j ∣ 格,奇偶性改变
( I − j ) m o d 2 (I-j)\bmod 2 ( I − j ) mod 2 。
引理 2:
i n v ( σ − 1 ) = i n v ( σ ) \mathrm{inv}(\sigma^{-1})=\mathrm{inv}(\sigma) inv ( σ − 1 ) = inv ( σ ) 。
考虑每一对
( i , j ) (i,j) ( i , j ) ,其中
i < j i<j i < j 。有
σ − 1 σ i = i , σ − 1 σ j = j {\sigma^{-1}}_{\sigma_i}=i,{\sigma^{-1}}_{\sigma_j}=j σ − 1 σ i = i , σ − 1 σ j = j 。如果
σ i < σ j \sigma_i<\sigma_j σ i < σ j ,那么
( σ i , σ j ) (\sigma_i,\sigma_j) ( σ i , σ j ) 在
σ − 1 \sigma^{-1} σ − 1 中不构成逆序对;
σ i > σ j \sigma_i>\sigma_j σ i > σ j 时构成。
定义 3:一个「
n n n 阶方阵」
A A A 是一个
n n n 行
n n n 列若干个元素组成的二维数组:
A = [ a 1 , 1 a 1 , 2 … a 1 , n a 2 , 1 a 2 , 2 … a 2 , n ⋮ ⋮ ⋱ ⋮ a n , 1 a n , 2 ⋯ a n , n ] A=
\begin{bmatrix}
a_{1,1}&&a_{1,2}&&\ldots&&a_{1,n}\\
a_{2,1}&&a_{2,2}&&\ldots&&a_{2,n}\\
\vdots&&\vdots&&\ddots&&\vdots\\
a_{n,1}&&a_{n,2}&&\cdots&&a_{n,n}
\end{bmatrix} A = a 1 , 1 a 2 , 1 ⋮ a n , 1 a 1 , 2 a 2 , 2 ⋮ a n , 2 … … ⋱ ⋯ a 1 , n a 2 , n ⋮ a n , n
定义 4:对于一个
n n n 阶方阵
A A A ,定义他的「转置」:
A T : = [ a 1 , 1 a 2 , 1 … a n , 1 a 1 , 2 a 2 , 2 … a n , 2 ⋮ ⋮ ⋱ ⋮ a 1 , n a 2 , n ⋯ a n , n ] A^T:=
\begin{bmatrix}
a_{1,1}&&a_{2,1}&&\ldots&&a_{n,1}\\
a_{1,2}&&a_{2,2}&&\ldots&&a_{n,2}\\
\vdots&&\vdots&&\ddots&&\vdots\\
a_{1,n}&&a_{2,n}&&\cdots&&a_{n,n}
\end{bmatrix} A T := a 1 , 1 a 1 , 2 ⋮ a 1 , n a 2 , 1 a 2 , 2 ⋮ a 2 , n … … ⋱ ⋯ a n , 1 a n , 2 ⋮ a n , n
定义 5:对于一个
n n n 阶方阵
A A A ,定义他的「行列式」
det ( A ) : = ∑ σ ∈ S n s g n ( σ ) ∏ i = 1 n a i , σ i \det(A):=\sum_{\sigma\in S_n}\mathrm{sgn}(\sigma)\prod_{i=1}^na_{i,\sigma_i} det ( A ) := ∑ σ ∈ S n sgn ( σ ) ∏ i = 1 n a i , σ i 。
时常将
det ( A ) \det(A) det ( A ) 记作:
∣ a 1 , 1 a 1 , 2 … a 1 , n a 2 , 1 a 2 , 2 … a 2 , n ⋮ ⋮ ⋱ ⋮ a n , 1 a n , 2 ⋯ a n , n ∣ \begin{vmatrix}
a_{1,1}&&a_{1,2}&&\ldots&&a_{1,n}\\
a_{2,1}&&a_{2,2}&&\ldots&&a_{2,n}\\
\vdots&&\vdots&&\ddots&&\vdots\\
a_{n,1}&&a_{n,2}&&\cdots&&a_{n,n}
\end{vmatrix} a 1 , 1 a 2 , 1 ⋮ a n , 1 a 1 , 2 a 2 , 2 ⋮ a n , 2 … … ⋱ ⋯ a 1 , n a 2 , n ⋮ a n , n
引理 3:
det ( A ) = det ( A T ) \det(A)=\det(A^T) det ( A ) = det ( A T ) 。
det ( A ) = ∑ σ ∈ S n s g n ( σ ) ∏ i = 1 n a i , σ i = ∑ σ ′ ∈ S n s g n ( σ ′ ) ∏ i = 1 n a σ ′ , i = det ( A ′ ) \begin{aligned}
\det(A)=&\sum_{\sigma\in S_n}\mathrm{sgn}(\sigma)\prod_{i=1}^na_{i,\sigma_i}\\
=&\sum_{\sigma'\in S_n}\mathrm{sgn}(\sigma')\prod_{i=1}^na_{\sigma',i}\\
=&\det(A')
\end{aligned} det ( A ) = = = σ ∈ S n ∑ sgn ( σ ) i = 1 ∏ n a i , σ i σ ′ ∈ S n ∑ sgn ( σ ′ ) i = 1 ∏ n a σ ′ , i det ( A ′ )
第二个等于是因为可以考虑
σ \sigma σ 和他的逆置换
σ ′ \sigma' σ ′ 一一对应。结合引理 2。
定义 6:对于一个
n n n 阶方阵
A A A ,定义它的「余子式」
A i j A_{ij} A ij 为
A A A 删掉第
i i i 行第
j j j 列得到的
n − 1 n-1 n − 1 阶方阵:
A i j : = [ a 1 , 1 ⋯ a 1 , j − 1 a 1 , j + 1 ⋯ a 1 , n ⋮ ⋱ ⋮ ⋮ ⋱ ⋮ a i − 1 , 1 ⋯ a i − 1 , j − 1 a i − 1 , j + 1 ⋯ a i − 1 , n a i + 1 , 1 ⋯ a i + 1 , j − 1 a i + 1 , j + 1 ⋯ a i + 1 , n ⋮ ⋱ ⋮ ⋮ ⋱ ⋮ a n , 1 ⋯ a n , j − 1 a n , j + 1 ⋯ a n , n ] A_{ij}:=
\begin{bmatrix}
a_{1,1}&&\cdots&&a_{1,j-1}&&a_{1,j+1}&&\cdots&&a_{1,n} \\
\vdots&&\ddots&&\vdots&&\vdots&&\ddots&&\vdots \\
a_{i-1,1}&&\cdots&&a_{i-1,j-1}&&a_{i-1,j+1}&&\cdots&&a_{i-1,n} \\
a_{i+1,1}&&\cdots&&a_{i+1,j-1}&&a_{i+1,j+1}&&\cdots&&a_{i+1,n} \\
\vdots&&\ddots&&\vdots&&\vdots&&\ddots&&\vdots \\
a_{n,1}&&\cdots&&a_{n,j-1}&&a_{n,j+1}&&\cdots&&a_{n,n}
\end{bmatrix} A ij := a 1 , 1 ⋮ a i − 1 , 1 a i + 1 , 1 ⋮ a n , 1 ⋯ ⋱ ⋯ ⋯ ⋱ ⋯ a 1 , j − 1 ⋮ a i − 1 , j − 1 a i + 1 , j − 1 ⋮ a n , j − 1 a 1 , j + 1 ⋮ a i − 1 , j + 1 a i + 1 , j + 1 ⋮ a n , j + 1 ⋯ ⋱ ⋯ ⋯ ⋱ ⋯ a 1 , n ⋮ a i − 1 , n a i + 1 , n ⋮ a n , n
引理 4:
∀ I : det ( A ) = ∑ j = 1 n a I , j ⋅ ( − 1 ) ∣ I − j ∣ ⋅ det ( A I j ) \forall I:\det(A)=\sum_{j=1}^na_{I,j}\cdot(-1)^{\lvert I-j\rvert}\cdot\det(A_{Ij}) ∀ I : det ( A ) = j = 1 ∑ n a I , j ⋅ ( − 1 ) ∣ I − j ∣ ⋅ det ( A I j )
证:
det ( A ) = ∑ σ ∈ S n s g n ( σ ) ∏ i = 1 n a i , σ i = ∑ j = 1 n a I , j ∑ σ ∈ S n , σ I = j s g n ( σ ) ∏ k ∈ [ 1 , n ] , k ≠ I a k , σ k = ∑ j = 1 n a I , j ∑ τ ∈ P e r m ( [ 1 , n ] ∖ { I } ) ( − 1 ) ∣ I − j ∣ s g n ( τ ) ∏ k ∈ [ 1 , n ] ∖ { I } a k , σ k = ∑ j = 1 n a I , j ⋅ ( − 1 ) ∣ I − j ∣ ⋅ det ( A I j ) \begin{aligned}
\det(A)=&\sum_{\sigma\in S_n}\mathrm{sgn}(\sigma)\prod_{i=1}^na_{i,\sigma_i}\\
=&\sum_{j=1}^na_{I,j}\sum_{\sigma\in S_n,\sigma_{I}=j}\mathrm{sgn}(\sigma)\prod_{k\in[1,n],k\neq I}a_{k,\sigma_k}\\
=&\sum_{j=1}^na_{I,j}\sum_{\tau\in\mathrm{Perm}([1,n]\setminus\{I\})}(-1)^{\lvert I-j\rvert}\mathrm{sgn}(\tau)\prod_{k\in[1,n]\setminus\{I\}}a_{k,\sigma_k}\\
=&\sum_{j=1}^na_{I,j}\cdot(-1)^{\lvert I-j\rvert}\cdot\det(A_{Ij})
\end{aligned} det ( A ) = = = = σ ∈ S n ∑ sgn ( σ ) i = 1 ∏ n a i , σ i j = 1 ∑ n a I , j σ ∈ S n , σ I = j ∑ sgn ( σ ) k ∈ [ 1 , n ] , k = I ∏ a k , σ k j = 1 ∑ n a I , j τ ∈ Perm ([ 1 , n ] ∖ { I }) ∑ ( − 1 ) ∣ I − j ∣ sgn ( τ ) k ∈ [ 1 , n ] ∖ { I } ∏ a k , σ k j = 1 ∑ n a I , j ⋅ ( − 1 ) ∣ I − j ∣ ⋅ det ( A I j )
第二行到第三行是因为:将一个
σ \sigma σ 一一对应到一个
τ \tau τ ,使得
σ = [ τ 1 , τ 2 , … , τ I − 1 , j , τ I , … , τ n − 1 ] \sigma=[\tau_1,\tau_2,\dots,\tau_{I-1},j,\tau_I,\dots,\tau_{n-1}] σ = [ τ 1 , τ 2 , … , τ I − 1 , j , τ I , … , τ n − 1 ] ,然后就是引理 1。
这一恒等变形称作「
A A A 在第
I I I 行做 Laplace 展开」。根据引理 3,有在第
J J J 列做 Laplace 展开:
∀ J : det ( A ) = ∑ i = 1 n a i , J ⋅ ( − 1 ) ∣ i − J ∣ ⋅ det ( A i J ) \forall J:\det(A)=\sum_{i=1}^na_{i,J}\cdot(-1)^{\lvert i-J\rvert}\cdot\det(A_{iJ}) ∀ J : det ( A ) = i = 1 ∑ n a i , J ⋅ ( − 1 ) ∣ i − J ∣ ⋅ det ( A i J )
【前置知识】连分数
如果你对证明不感兴趣,可以跳过这一章节。
定义 1:一个「连分数」记作
[ a 0 ; a 1 , a 2 , … , a n ] [a_0;a_1,a_2,\dots,a_n] [ a 0 ; a 1 , a 2 , … , a n ] ,其值为
a 0 + 1 a 1 + 1 ⋱ 1 a n a_0+\frac1{a_1+\frac1{\ddots\frac1{a_n}}} a 0 + a 1 + ⋱ a n 1 1 1
定义 2:
x = [ a 0 ; a 1 , … , a n ] x=[a_0;a_1,\dots,a_n] x = [ a 0 ; a 1 , … , a n ] 的「第
k k k 个渐进分数」定义为
[ a 0 ; a 1 , … , a k ] [a_0;a_1,\dots,a_k] [ a 0 ; a 1 , … , a k ] ,记作
x k = : p ( x ) k q ( x ) k x_k=:\frac{p(x)_k}{q(x)_k} x k =: q ( x ) k p ( x ) k ,其中
p ( x ) k q ( x ) k \frac{p(x)_k}{q(x)_k} q ( x ) k p ( x ) k 既约。在不引起歧义的情况下会记作
p k q k \frac{p_k}{q_k} q k p k ,将
a b \frac ab b a 的第
k k k 个渐进分数记作
a b k {\frac ab}_k b a k 。
引理 1:
p k = a k p k − 1 + p k − 2 q k = a k q k − 1 + q k − 2 p_k=a_kp_{k-1}+p_{k-2}\\
q_k=a_kq_{k-1}+q_{k-2} p k = a k p k − 1 + p k − 2 q k = a k q k − 1 + q k − 2
递推的起点为
p − 1 = 1 , q − 1 = 0 p − 2 = 0 , q − 2 = 1 p_{-1}=1,q_{-1}=0\\
p_{-2}=0,q_{-2}=1 p − 1 = 1 , q − 1 = 0 p − 2 = 0 , q − 2 = 1
证:
p k p_k p k 可以看作关于
a 0 , a 1 , … , a k a_0,a_1,\dots,a_k a 0 , a 1 , … , a k 的多项式
P k ( a 0 , … , a k ) P_k(a_0,\dots,a_k) P k ( a 0 , … , a k ) ,同理
q k = : Q k ( a 0 , … , a k ) q_k=:Q_k(a_0,\dots,a_k) q k =: Q k ( a 0 , … , a k ) 。此时
Q k ( a 0 , … , a k ) = P k − 1 ( a 1 , … , a k ) Q_k(a_0,\dots,a_k)=P_{k-1}(a_1,\dots,a_k) Q k ( a 0 , … , a k ) = P k − 1 ( a 1 , … , a k ) 。OI Wiki 上只说了个不妨设,没搞明白。
分析
Q k ( a 0 , … , a k ) Q_k(a_0,\dots,a_k) Q k ( a 0 , … , a k ) :
[ a 0 ; a 1 , … , a k ] = a 0 + 1 [ a 1 ; a 2 , … , a k ] = a 0 + 1 a 1 + 1 [ a 2 ; a 3 , … , a k ] = a 0 + 1 a 1 + Q k − 2 ( a 2 , … , a k ) P k − 2 ( a 2 , … , a k ) = a 0 + 1 a 1 P k − 2 ( a 2 , … , a k ) + Q k − 2 ( a 2 , … , a k ) P k − 2 ( a 2 , … , a k ) = a 0 + P k − 2 ( a 2 , … , a k ) a 1 P k − 2 ( a 2 , … , a k ) + Q k − 2 ( a 2 , … , a k ) Q k ( a 0 , … , a k ) = a 1 P k − 2 ( a 2 , … , a k ) + Q k − 2 ( a 2 , … , a k ) \begin{aligned}
&[a_0;a_1,\dots,a_k]\\
=&a_0+\frac1{[a_1;a_2,\dots,a_k]}\\
=&a_0+\frac1{a_1+\frac1{[a_2;a_3,\dots,a_k]}}\\
=&a_0+\frac1{a_1+\frac{Q_{k-2}(a_2,\dots,a_k)}{P_{k-2}(a_2,\dots,a_k)}}\\
=&a_0+\frac1{\frac{a_1P_{k-2}(a_2,\dots,a_k)+Q_{k-2}(a_2,\dots,a_k)}{P_{k-2}(a_2,\dots,a_k)}}\\
=&a_0+\frac{P_{k-2}(a_2,\dots,a_k)}{a_1P_{k-2}(a_2,\dots,a_k)+Q_{k-2}(a_2,\dots,a_k)}\\
&Q_k(a_0,\dots,a_k)\\
=&a_1P_{k-2}(a_2,\dots,a_k)+Q_{k-2}(a_2,\dots,a_k)
\end{aligned} = = = = = = [ a 0 ; a 1 , … , a k ] a 0 + [ a 1 ; a 2 , … , a k ] 1 a 0 + a 1 + [ a 2 ; a 3 , … , a k ] 1 1 a 0 + a 1 + P k − 2 ( a 2 , … , a k ) Q k − 2 ( a 2 , … , a k ) 1 a 0 + P k − 2 ( a 2 , … , a k ) a 1 P k − 2 ( a 2 , … , a k ) + Q k − 2 ( a 2 , … , a k ) 1 a 0 + a 1 P k − 2 ( a 2 , … , a k ) + Q k − 2 ( a 2 , … , a k ) P k − 2 ( a 2 , … , a k ) Q k ( a 0 , … , a k ) a 1 P k − 2 ( a 2 , … , a k ) + Q k − 2 ( a 2 , … , a k )
再来分析
P k − 1 ( a 1 , … , a k ) P_{k-1}(a_1,\dots,a_k) P k − 1 ( a 1 , … , a k ) :
[ a 1 ; a 2 , … , a k ] = a 1 + 1 [ a 2 ; a 3 , … , a k ] = a 1 + Q k − 2 ( a 2 , … , a k ) P k − 2 ( a 2 , … , a k ) = a 1 P k − 2 ( a 2 , … , a k ) + Q k − 2 ( a 2 , … , a k ) P k − 2 ( a 2 , … , a k ) P k − 1 ( a 1 , … , a k ) = a 1 P k − 2 ( a 2 , … , a k ) + Q k − 2 ( a 2 , … , a k ) \begin{aligned}
&[a_1;a_2,\dots,a_k]\\
=&a_1+\frac1{[a_2;a_3,\dots,a_k]}\\
=&a_1+\frac{Q_{k-2}(a_2,\dots,a_k)}{P_{k-2}(a_2,\dots,a_k)}\\
=&\frac{a_1P_{k-2}(a_2,\dots,a_k)+Q_{k-2}(a_2,\dots,a_k)}{P_{k-2}(a_2,\dots,a_k)}\\
&P_{k-1}(a_1,\dots,a_k)\\
=&a_1P_{k-2}(a_2,\dots,a_k)+Q_{k-2}(a_2,\dots,a_k)
\end{aligned} = = = = [ a 1 ; a 2 , … , a k ] a 1 + [ a 2 ; a 3 , … , a k ] 1 a 1 + P k − 2 ( a 2 , … , a k ) Q k − 2 ( a 2 , … , a k ) P k − 2 ( a 2 , … , a k ) a 1 P k − 2 ( a 2 , … , a k ) + Q k − 2 ( a 2 , … , a k ) P k − 1 ( a 1 , … , a k ) a 1 P k − 2 ( a 2 , … , a k ) + Q k − 2 ( a 2 , … , a k )
一方面:
x k = p k q k = P k ( a 0 , … , a k ) Q k ( a 0 , … , a k ) x_k=\frac{p_k}{q_k}=\frac{P_k(a_0,\dots,a_k)}{Q_k(a_0,\dots,a_k)} x k = q k p k = Q k ( a 0 , … , a k ) P k ( a 0 , … , a k )
一方面:
x k = [ a 0 ; a 1 , … , a k ] = a 0 + 1 [ a 1 ; a 2 , … , a k ] = a 0 + 1 P k − 1 ( a 1 , … , a k ) Q k − 1 ( a 1 , … , a k ) = a 0 P k − 1 ( a 1 , … , a k ) + Q k − 1 ( a 1 , … , a k ) P k − 1 ( a 1 , … , a k ) \begin{aligned}
x_k=&[a_0;a_1,\dots,a_k]\\
=&a_0+\frac1{[a_1;a_2,\dots,a_k]}\\
=&a_0+\frac1{\frac{P_{k-1}(a_1,\dots,a_k)}{Q_{k-1}(a_1,\dots,a_k)}}\\
=&\frac{a_0P_{k-1}(a_1,\dots,a_k)+Q_{k-1}(a_1,\dots,a_k)}{P_{k-1}(a_1,\dots,a_k)}
\end{aligned} x k = = = = [ a 0 ; a 1 , … , a k ] a 0 + [ a 1 ; a 2 , … , a k ] 1 a 0 + Q k − 1 ( a 1 , … , a k ) P k − 1 ( a 1 , … , a k ) 1 P k − 1 ( a 1 , … , a k ) a 0 P k − 1 ( a 1 , … , a k ) + Q k − 1 ( a 1 , … , a k )
所以
P k ( a 0 , … , a k ) Q k ( a 0 , … , a k ) = a 0 P k − 1 ( a 1 , … , a k ) + Q k − 1 ( a 1 , … , a k ) P k − 1 ( a 1 , … , a k ) P k ( a 0 , … , a k ) = a 0 P k − 1 ( a 1 , … , a k ) + Q k − 1 ( a 1 , … , a k ) = a 0 P k − 1 ( a 1 , … , a k ) + P k − 2 ( a 2 , … , a k ) \begin{aligned}
\frac{P_k(a_0,\dots,a_k)}{Q_k(a_0,\dots,a_k)}=&\frac{a_0P_{k-1}
(a_1,\dots,a_k)+Q_{k-1}(a_1,\dots,a_k)}{P_{k-1}(a_1,\dots,a_k)}\\
P_k(a_0,\dots,a_k)=&a_0P_{k-1}(a_1,\dots,a_k)+Q_{k-1}(a_1,\dots,a_k)\\
=&a_0P_{k-1}(a_1,\dots,a_k)+P_{k-2}(a_2,\dots,a_k)
\end{aligned} Q k ( a 0 , … , a k ) P k ( a 0 , … , a k ) = P k ( a 0 , … , a k ) = = P k − 1 ( a 1 , … , a k ) a 0 P k − 1 ( a 1 , … , a k ) + Q k − 1 ( a 1 , … , a k ) a 0 P k − 1 ( a 1 , … , a k ) + Q k − 1 ( a 1 , … , a k ) a 0 P k − 1 ( a 1 , … , a k ) + P k − 2 ( a 2 , … , a k )
M k ( a 0 , … , a k ) : = [ a 0 1 0 ⋯ 0 0 0 − 1 a 1 1 ⋯ 0 0 0 0 − 1 a 2 ⋯ 0 0 0 ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ 0 0 0 ⋯ a k − 2 1 0 0 0 0 ⋯ − 1 a k − 1 1 0 0 0 ⋯ 0 − 1 a k ] M_k(a_0,\dots,a_k):=
\begin{bmatrix}
a_0&&1&&0&&\cdots&&0&&0&&0\\
-1&&a_1&&1&&\cdots&&0&&0&&0\\
0&&-1&&a_2&&\cdots&&0&&0&&0\\
\vdots&&\vdots&&\vdots&&\ddots&&\vdots&&\vdots&&\vdots&&\\
0&&0&&0&&\cdots&&a_{k-2}&&1&&0\\
0&&0&&0&&\cdots&&-1&&a_{k-1}&&1\\
0&&0&&0&&\cdots&&0&&-1&&a_k
\end{bmatrix} M k ( a 0 , … , a k ) := a 0 − 1 0 ⋮ 0 0 0 1 a 1 − 1 ⋮ 0 0 0 0 1 a 2 ⋮ 0 0 0 ⋯ ⋯ ⋯ ⋱ ⋯ ⋯ ⋯ 0 0 0 ⋮ a k − 2 − 1 0 0 0 0 ⋮ 1 a k − 1 − 1 0 0 0 ⋮ 0 1 a k
行列号为
1 1 1 到
k + 1 k+1 k + 1 。下证
det ( M k ( a 0 , … , a k ) ) = P k ( a 0 , … , a k ) \det(M_k(a_0,\dots,a_k))=P_k(a_0,\dots,a_k) det ( M k ( a 0 , … , a k )) = P k ( a 0 , … , a k ) 。
k = 0 k=0 k = 0 时,
det ( M 0 ( a 0 ) ) = a 0 = P 0 ( a 0 ) \det(M_0(a_0))=a_0=P_0(a_0) det ( M 0 ( a 0 )) = a 0 = P 0 ( a 0 ) 。
k = 1 k=1 k = 1 时,
det ( M 1 ( a 0 , a 1 ) ) = a 0 a 1 − 1 × ( − 1 ) = a 0 a 1 + 1 = P 1 ( a 0 , a 1 ) \det(M_1(a_0,a_1))=a_0a_1-1\times(-1)=a_0a_1+1=P_1(a_0,a_1) det ( M 1 ( a 0 , a 1 )) = a 0 a 1 − 1 × ( − 1 ) = a 0 a 1 + 1 = P 1 ( a 0 , a 1 ) 。
k ≥ 2 k\ge 2 k ≥ 2 时,考虑对
M k ( a 0 , … , a k ) M_k(a_0,\dots,a_k) M k ( a 0 , … , a k ) 在第
1 1 1 行做 Laplace 展开:
det ( M k ( a 0 , … , a k ) ) = ∑ j = 1 k + 1 ( M k ( a 0 , … , a k ) ) 1 , j ⋅ ( − 1 ) j − 1 ⋅ det ( ( M k ( a 0 , … , a k ) ) 1 j ) = a 0 det ( ( M k ( a 0 , … , a k ) ) 11 ) − det ( ( M k ( a 0 , … , a k ) ) 12 ) \begin{aligned}
&\det(M_k(a_0,\dots,a_k))\\
=&\sum_{j=1}^{k+1}(M_k(a_0,\dots,a_k))_{1,j}\cdot(-1)^{j-1}\cdot\det((M_k(a_0,\dots,a_k))_{1j})\\
=&a_0\det((M_k(a_0,\dots,a_k))_{11})-\det((M_k(a_0,\dots,a_k))_{12})
\end{aligned} = = det ( M k ( a 0 , … , a k )) j = 1 ∑ k + 1 ( M k ( a 0 , … , a k ) ) 1 , j ⋅ ( − 1 ) j − 1 ⋅ det (( M k ( a 0 , … , a k ) ) 1 j ) a 0 det (( M k ( a 0 , … , a k ) ) 11 ) − det (( M k ( a 0 , … , a k ) ) 12 )
对两个加数分别分析。
前者:
( M k ( a 0 , … , a k ) ) 11 = [ a 1 1 ⋯ 0 0 0 − 1 a 2 ⋯ 0 0 0 ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ 0 0 ⋯ a k − 2 1 0 0 0 ⋯ − 1 a k − 1 1 0 0 ⋯ 0 − 1 a k ] ( M k ( a 0 , … , a k ) ) 11 = M k − 1 ( a 1 , … , a k ) (M_k(a_0,\dots,a_k))_{11}=
\begin{bmatrix}
a_1&&1&&\cdots&&0&&0&&0\\
-1&&a_2&&\cdots&&0&&0&&0\\
\vdots&&\vdots&&\ddots&&\vdots&&\vdots&&\vdots&&\\
0&&0&&\cdots&&a_{k-2}&&1&&0\\
0&&0&&\cdots&&-1&&a_{k-1}&&1\\
0&&0&&\cdots&&0&&-1&&a_k
\end{bmatrix}\\
(M_k(a_0,\dots,a_k))_{11}=M_{k-1}(a_1,\dots,a_k)\\ ( M k ( a 0 , … , a k ) ) 11 = a 1 − 1 ⋮ 0 0 0 1 a 2 ⋮ 0 0 0 ⋯ ⋯ ⋱ ⋯ ⋯ ⋯ 0 0 ⋮ a k − 2 − 1 0 0 0 ⋮ 1 a k − 1 − 1 0 0 ⋮ 0 1 a k ( M k ( a 0 , … , a k ) ) 11 = M k − 1 ( a 1 , … , a k )
后者:
( M k ( a 0 , … , a k ) ) 12 = [ − 1 1 ⋯ 0 0 0 0 a 2 ⋯ 0 0 0 ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ 0 0 ⋯ a k − 2 1 0 0 0 ⋯ − 1 a k − 1 1 0 0 ⋯ 0 − 1 a k ] (M_k(a_0,\dots,a_k))_{12}=
\begin{bmatrix}
-1&&1&&\cdots&&0&&0&&0\\
0&&a_2&&\cdots&&0&&0&&0\\
\vdots&&\vdots&&\ddots&&\vdots&&\vdots&&\vdots&&\\
0&&0&&\cdots&&a_{k-2}&&1&&0\\
0&&0&&\cdots&&-1&&a_{k-1}&&1\\
0&&0&&\cdots&&0&&-1&&a_k
\end{bmatrix} ( M k ( a 0 , … , a k ) ) 12 = − 1 0 ⋮ 0 0 0 1 a 2 ⋮ 0 0 0 ⋯ ⋯ ⋱ ⋯ ⋯ ⋯ 0 0 ⋮ a k − 2 − 1 0 0 0 ⋮ 1 a k − 1 − 1 0 0 ⋮ 0 1 a k
看到他的第一列只有一个非
0 0 0 ,考虑对他在第一列做 Laplace 展开:
det ( ( M k ( a 0 , … , a k ) ) 12 ) = ∑ i = 1 k ( ( M k ( a 0 , … , a k ) ) 12 ) i , 1 ⋅ ( − 1 ) i − 1 ⋅ det ( ( ( M k ( a 0 , … , a k ) ) 12 ) i 1 ) = − det ( ( ( M k ( a 0 , … , a k ) ) 12 ) 11 ) = − det ( M k − 2 ( a 2 , … , a k ) ) \begin{aligned}
&\det((M_k(a_0,\dots,a_k))_{12})\\
=&\sum_{i=1}^k((M_k(a_0,\dots,a_k))_{12})_{i,1}\cdot(-1)^{i-1}\cdot\det(((M_k(a_0,\dots,a_k))_{12})_{i1})\\
=&-\det(((M_k(a_0,\dots,a_k))_{12})_{11})\\
=&-\det(M_{k-2}(a_2,\dots,a_k))
\end{aligned} = = = det (( M k ( a 0 , … , a k ) ) 12 ) i = 1 ∑ k (( M k ( a 0 , … , a k ) ) 12 ) i , 1 ⋅ ( − 1 ) i − 1 ⋅ det ((( M k ( a 0 , … , a k ) ) 12 ) i 1 ) − det ((( M k ( a 0 , … , a k ) ) 12 ) 11 ) − det ( M k − 2 ( a 2 , … , a k ))
将分析结果代入,得:
det ( M k ( a 0 , … , a k ) ) = a 0 det ( ( M k ( a 0 , … , a k ) ) 11 ) − det ( ( M k ( a 0 , … , a k ) ) 12 ) = a 0 det ( M k − 1 ( a 1 , … , a k ) ) + det ( M k − 2 ( a 2 , … , a k ) ) \begin{aligned}
&\det(M_k(a_0,\dots,a_k))\\
=&a_0\det((M_k(a_0,\dots,a_k))_{11})-\det((M_k(a_0,\dots,a_k))_{12})\\
=&a_0\det(M_{k-1}(a_1,\dots,a_k))+\det(M_{k-2}(a_2,\dots,a_k))
\end{aligned} = = det ( M k ( a 0 , … , a k )) a 0 det (( M k ( a 0 , … , a k ) ) 11 ) − det (( M k ( a 0 , … , a k ) ) 12 ) a 0 det ( M k − 1 ( a 1 , … , a k )) + det ( M k − 2 ( a 2 , … , a k ))
对比
det ( M k ( a 0 , … , a k ) ) \det(M_k(a_0,\dots,a_k)) det ( M k ( a 0 , … , a k )) 和
P k ( a 0 , … , a k ) P_k(a_0,\dots,a_k) P k ( a 0 , … , a k ) ,发现他们的初值一样,递推关系一样,所以二者完全相同:
det ( M k ( a 0 , … , a k ) ) = P k ( a 0 , … , a k ) \det(M_k(a_0,\dots,a_k))=P_k(a_0,\dots,a_k) det ( M k ( a 0 , … , a k )) = P k ( a 0 , … , a k ) 。
det ( M k ( a 0 , … , a k ) ) = a k det ( M k − 1 ( a 0 , … , a k − 1 ) ) + det ( M k − 2 ( a 0 , … , a k − 2 ) ) P k ( a 0 , … , a k ) = a k P k − 1 ( a 0 , … , a k − 1 ) + P k − 2 ( a 0 , … , a k − 2 ) \det(M_k(a_0,\dots,a_k))=a_k\det(M_{k-1}(a_0,\dots,a_{k-1}))+\det(M_{k-2}(a_0,\dots,a_{k-2}))\\
P_k(a_0,\dots,a_k)=a_kP_{k-1}(a_0,\dots,a_{k-1})+P_{k-2}(a_0,\dots,a_{k-2}) det ( M k ( a 0 , … , a k )) = a k det ( M k − 1 ( a 0 , … , a k − 1 )) + det ( M k − 2 ( a 0 , … , a k − 2 )) P k ( a 0 , … , a k ) = a k P k − 1 ( a 0 , … , a k − 1 ) + P k − 2 ( a 0 , … , a k − 2 )
p k = a k p k − 1 + p k − 2 p_k=a_kp_{k-1}+p_{k-2} p k = a k p k − 1 + p k − 2
P k − 1 ( a 1 , … , a k ) = a k P k − 2 ( a 1 , … , a k − 1 ) + P k − 3 ( a 1 , … , a k − 2 ) Q k ( a 0 , … , a k ) = a k Q k − 1 ( a 0 , … , a k − 1 ) + P k − 2 ( a 0 , … , a k − 2 ) q k = a k q k − 1 + q k − 2 P_{k-1}(a_1,\dots,a_k)=a_kP_{k-2}(a_1,\dots,a_{k-1})+P_{k-3}(a_1,\dots,a_{k-2})\\
Q_k(a_0,\dots,a_k)=a_kQ_{k-1}(a_0,\dots,a_{k-1})+P_{k-2}(a_0,\dots,a_{k-2})\\
q_k=a_kq_{k-1}+q_{k-2} P k − 1 ( a 1 , … , a k ) = a k P k − 2 ( a 1 , … , a k − 1 ) + P k − 3 ( a 1 , … , a k − 2 ) Q k ( a 0 , … , a k ) = a k Q k − 1 ( a 0 , … , a k − 1 ) + P k − 2 ( a 0 , … , a k − 2 ) q k = a k q k − 1 + q k − 2
递推式证明完毕。将
p − 1 = 1 , q − 1 = 0 , p − 2 = 0 , q − 2 = 1 p_{-1}=1,q_{-1}=0,p_{-2}=0,q_{-2}=1 p − 1 = 1 , q − 1 = 0 , p − 2 = 0 , q − 2 = 1 代入,得:
p 0 = a 0 p − 1 + p − 2 = a 0 q 0 = a 0 q − 1 + q − 2 = 1 p 1 = a 1 p 0 + p − 1 = a 0 a 1 + 1 q 1 = a 1 q 0 + q − 1 = a 0 p_0=a_0p_{-1}+p_{-2}=a_0\\
q_0=a_0q_{-1}+q_{-2}=1\\
p_1=a_1p_0+p_{-1}=a_0a_1+1\\
q_1=a_1q_0+q_{-1}=a_0 p 0 = a 0 p − 1 + p − 2 = a 0 q 0 = a 0 q − 1 + q − 2 = 1 p 1 = a 1 p 0 + p − 1 = a 0 a 1 + 1 q 1 = a 1 q 0 + q − 1 = a 0
符合。证毕。
引理 2:
p k + 1 q k − p k q k + 1 = ( − 1 ) k p_{k+1}q_k-p_kq_{k+1}=(-1)^k p k + 1 q k − p k q k + 1 = ( − 1 ) k 。
证:
∣ p k + 1 p k q k + 1 q k ∣ = ∣ a k p k + p k − 1 p k a k q k + q k − 1 q k ∣ = ∣ p k − 1 p k q k − 1 q k ∣ = − ∣ p k p k − 1 q k q k − 1 ∣ = ( − 1 ) k + 2 ∣ p − 1 p − 2 q − 1 q − 2 ∣ = ( − 1 ) k \begin{aligned}
\begin{vmatrix}p_{k+1}&p_k\\q_{k+1}&q_k\end{vmatrix}=&\begin{vmatrix}a_kp_k+p_{k-1}&p_k\\a_kq_k+q_{k-1}&q_k\end{vmatrix}\\
=&\begin{vmatrix}p_{k-1}&p_k\\q_{k-1}&q_k\end{vmatrix}\\
=&-\begin{vmatrix}p_k&p_{k-1}\\q_k&q_{k-1}\end{vmatrix}\\
=&(-1)^{k+2}\begin{vmatrix}p_{-1}&p_{-2}\\q_{-1}&q_{-2}\end{vmatrix}\\
=&(-1)^k
\end{aligned} p k + 1 q k + 1 p k q k = = = = = a k p k + p k − 1 a k q k + q k − 1 p k q k p k − 1 q k − 1 p k q k − p k q k p k − 1 q k − 1 ( − 1 ) k + 2 p − 1 q − 1 p − 2 q − 2 ( − 1 ) k
推论 1:
x k + 1 − x k = ( − 1 ) k q k q k + 1 x_{k+1}-x_k=\frac{(-1)^k}{q_kq_{k+1}} x k + 1 − x k = q k q k + 1 ( − 1 ) k 。
注意,引理 1,引理 2 和推论 1 在
a i ∉ Z a_i\notin\Z a i ∈ / Z 时同样成立。
定义 3:对
x = [ a 0 ; a 1 , … , a n ] x=[a_0;a_1,\dots,a_n] x = [ a 0 ; a 1 , … , a n ] ,定义它的「第
k k k 个余项」
r ( x ) k : = [ a k ; a k + 1 , … , a n ] r(x)_k:=[a_k;a_{k+1},\dots,a_n] r ( x ) k := [ a k ; a k + 1 , … , a n ] 。不引起歧义的情况下可能记作
r k r_k r k 。
引理 3:
x − x k = ( − 1 ) k q k ( r k + 1 q k + q k − 1 ) x-x_k=\frac{(-1)^k}{q_k(r_{k+1}q_k+q_{k-1})} x − x k = q k ( r k + 1 q k + q k − 1 ) ( − 1 ) k 。
证:结合
x = [ a 0 ; a 1 , … , a k , r k + 1 ] x=[a_0;a_1,\dots,a_k,r_{k+1}] x = [ a 0 ; a 1 , … , a k , r k + 1 ] ,引理 2 和引理 1。
引理 4:
∣ x − x k ∣ ≤ 1 q k q k + 1 \lvert x-x_k\rvert\le\frac1{q_kq_{k+1}} ∣ x − x k ∣ ≤ q k q k + 1 1 。
证:
a k + 1 = ⌊ r k + 1 ⌋ ≤ r k + 1 a_{k+1}=\lfloor r_{k+1}\rfloor\le r_{k+1} a k + 1 = ⌊ r k + 1 ⌋ ≤ r k + 1 ,由引理 1
q k + 1 = a k + 1 q k + q k − 1 q_{k+1}=a_{k+1}q_k+q_{k-1} q k + 1 = a k + 1 q k + q k − 1 和引理 3 推得原命题。
【前置知识】其他
Dirichlet 卷积
定义 1:
N → C \N\to\Complex N → C 的映射叫做「数论函数」。
定义 2:对于两个数论函数
f , g f,g f , g ,定义
( f ∗ g ) ( x ) : = ∑ i j = x f ( i ) g ( j ) (f\ast g)(x):=\sum_{ij=x}f(i)g(j) ( f ∗ g ) ( x ) := ∑ ij = x f ( i ) g ( j ) 。函数
( f ∗ g ) (f\ast g) ( f ∗ g ) 称作
f f f 与
g g g 的「Dirichlet 卷积」。
定义 3:如果数论函数
f f f 满足
∀ a , b : f ( a b ) = f ( a ) f ( b ) \forall a,b:f(ab)=f(a)f(b) ∀ a , b : f ( ab ) = f ( a ) f ( b ) ,那么
f f f 是一个「完全积性函数」。
离散介值定理(?)
本章无特殊说明所有区间在
R \R R 上不在
Z \Z Z 上。
这个不是《离散介值定理及其应用》中提到的离散介值定理,但类似。
定理 1:对于定义在
[ l , r ] ∩ Z [l,r]\cap\Z [ l , r ] ∩ Z 上的函数
f f f ,如果
f ( x ) = A , f ( y ) = B , A < B f(x)=A,f(y)=B,A<B f ( x ) = A , f ( y ) = B , A < B ,那么
∀ C ∈ [ A , B ] : ∃ z ∈ [ x , y ] : C ∈ [ f ( z ) , f ( z + 1 ) ) \forall C\in[A,B]:\exists z\in[x,y]:C\in[f(z),f(z+1)) ∀ C ∈ [ A , B ] : ∃ z ∈ [ x , y ] : C ∈ [ f ( z ) , f ( z + 1 )) 。
证:
C = A C=A C = A 或
C = B C=B C = B 时显然成立。否则,考虑集合
S : = { i ∣ f ( i ) > C } S:=\{i\mid f(i)>C\} S := { i ∣ f ( i ) > C } ,显然
y ∈ S y\in S y ∈ S ,故
S S S 非空。考虑
p : = min S p:=\min S p := min S ,显然
p > x p>x p > x ,所以
f ( p − 1 ) ≤ C f(p-1)\le C f ( p − 1 ) ≤ C 。那么
z : = p − 1 z:=p-1 z := p − 1 代入原命题显然成立。
Fermat 平方和定理
Fermat 平方和定理:
∀ odd prime p : ( ∃ a , b ∈ N : a 2 + b 2 = p ) ⇔ p ≡ 1 ( m o d 4 ) \forall\text{ odd prime }p:(\exists a,b\in\N:a^2+b^2=p)\Leftrightarrow p\equiv1\pmod4 ∀ odd prime p : ( ∃ a , b ∈ N : a 2 + b 2 = p ) ⇔ p ≡ 1 ( mod 4 ) 。
证明:
定义
S : = { ( x , y , z ) ∣ x 2 + 4 y z = p , ( x , y , z ) ∈ N 3 } S:=\{(x,y,z)\mid x^2+4yz=p,(x,y,z)\in\N^3\} S := {( x , y , z ) ∣ x 2 + 4 yz = p , ( x , y , z ) ∈ N 3 } ,显然是有限的,且里面没有
0 0 0 (
y = 0 ∨ z = 0 ⇒ x 2 = p , x = 0 ⇒ 4 y z = p y=0\lor z=0\Rightarrow x^2=p,x=0\Rightarrow 4yz=p y = 0 ∨ z = 0 ⇒ x 2 = p , x = 0 ⇒ 4 yz = p ),还一定有
x ≠ y − z x\neq y-z x = y − z (
x = y − z ⇒ ( y + z ) 2 = p x=y-z\Rightarrow (y+z)^2=p x = y − z ⇒ ( y + z ) 2 = p )和
x ≠ 2 y x\neq 2y x = 2 y (
x = 2 y ⇒ 4 y ( y + z ) = p x=2y\Rightarrow 4y(y+z)=p x = 2 y ⇒ 4 y ( y + z ) = p )。
考虑两个映射:
f ( x , y , z ) = ( x , z , y ) g ( x , y , z ) = { ( x + 2 z , z , y − x − z ) , x < y − z ( 2 y − x , y , x − y + z ) , y − z < x < 2 y ( x − 2 y , x − y + z , y ) , otherwise. f(x,y,z)=(x,z,y)\\
g(x,y,z)=
\begin{aligned}\begin{cases}
(x+2z,z,y-x-z),\quad&x<y-z\\
(2y-x,y,x-y+z),\quad&y-z<x<2y\\
(x-2y,x-y+z,y),\quad&\text{otherwise.}
\end{cases}\end{aligned} f ( x , y , z ) = ( x , z , y ) g ( x , y , z ) = ⎩ ⎨ ⎧ ( x + 2 z , z , y − x − z ) , ( 2 y − x , y , x − y + z ) , ( x − 2 y , x − y + z , y ) , x < y − z y − z < x < 2 y otherwise.
由于
( x + 2 z ) 2 + 4 z ( y − x − z ) = x 2 + 4 z 2 + 4 x z − 4 x z + 4 y z − 4 z 2 = x 2 + 4 y z ( 2 y − x ) 2 + 4 y ( x − y + z ) = x 2 + 4 y 2 − 4 x y + 4 y x − 4 y 2 + 4 y z = x 2 + 4 y z ( x − 2 y ) 2 + 4 y ( x − y + z ) = x 2 + 4 y z (x+2z)^2+4z(y-x-z)=x^2+4z^2+4xz-4xz+4yz-4z^2=x^2+4yz\\
(2y-x)^2+4y(x-y+z)=x^2+4y^2-4xy+4yx-4y^2+4yz=x^2+4yz\\
(x-2y)^2+4y(x-y+z)=x^2+4yz ( x + 2 z ) 2 + 4 z ( y − x − z ) = x 2 + 4 z 2 + 4 x z − 4 x z + 4 yz − 4 z 2 = x 2 + 4 yz ( 2 y − x ) 2 + 4 y ( x − y + z ) = x 2 + 4 y 2 − 4 x y + 4 y x − 4 y 2 + 4 yz = x 2 + 4 yz ( x − 2 y ) 2 + 4 y ( x − y + z ) = x 2 + 4 yz
所以
f , g : S → S f,g:S\to S f , g : S → S 。
注意到
g g g 是对合(自身是自身逆映射的映射):
第一次所选分支 一次映射结果 第二次所选分支 二次映射结果 x < y − z x<y-z x < y − z ( x + 2 z , z , y − x − z ) (x+2z,z,y-x-z) ( x + 2 z , z , y − x − z ) 2 y ′ < x ′ 2y'<x' 2 y ′ < x ′ ( x + 2 z − 2 z , x + 2 z − z + y − x − z , z ) (x+2z-2z,x+2z-z+y-x-z,z) ( x + 2 z − 2 z , x + 2 z − z + y − x − z , z ) y − z < x < 2 y y-z<x<2y y − z < x < 2 y ( 2 y − x , y , x − y + z ) (2y-x,y,x-y+z) ( 2 y − x , y , x − y + z ) y ′ − z ′ < x ′ < 2 y ′ y'-z'<x'<2y' y ′ − z ′ < x ′ < 2 y ′ ( 2 y − 2 y + x , y , 2 y − x − y + x − y + z ) (2y-2y+x,y,2y-x-y+x-y+z) ( 2 y − 2 y + x , y , 2 y − x − y + x − y + z ) 2 y < x 2y<x 2 y < x ( x − 2 y , x − y + z , y ) (x-2y,x-y+z,y) ( x − 2 y , x − y + z , y ) x ′ < y ′ − z ′ x'<y'-z' x ′ < y ′ − z ′ ( x − 2 y + 2 y , y , x − y + z − x + 2 y − y ) (x-2y+2y,y,x-y+z-x+2y-y) ( x − 2 y + 2 y , y , x − y + z − x + 2 y − y )
再来考虑
g g g 的不动点,
( x , y , z ) (x,y,z) ( x , y , z ) 只有可能走
y − z < x < 2 y y-z<x<2y y − z < x < 2 y 的分支(否则可以考虑映射后的
x x x ,显然
x + 2 z , x − 2 y ≠ x x+2z,x-2y\neq x x + 2 z , x − 2 y = x ),因而
2 y − x = x 2y-x=x 2 y − x = x ,推出
x = y x=y x = y ,结合
x 2 + 4 y z = p x^2+4yz=p x 2 + 4 yz = p 得到
x ( x + 4 z ) = p x(x+4z)=p x ( x + 4 z ) = p ,所以
x = 1 , y = 1 , z = ⌊ p − 1 4 ⌋ x=1,y=1,z=\left\lfloor\frac{p-1}4\right\rfloor x = 1 , y = 1 , z = ⌊ 4 p − 1 ⌋ 。他是
g g g 唯一的不动点。又因为
g g g 是对合,可以将
S ∖ { ( 1 , 1 , ⌊ p − 1 4 ⌋ ) } S\setminus{\left\{\left(1,1,\left\lfloor\frac{p-1}4\right\rfloor\right)\right\}} S ∖ { ( 1 , 1 , ⌊ 4 p − 1 ⌋ ) } 中的元素两两配对,所以
∣ S ∣ |S| ∣ S ∣ 为奇。又
f f f 是对合,所以至少存在一个不动点,此时
y = z y=z y = z ,即
x 2 + y 2 = p x^2+y^2=p x 2 + y 2 = p ,Fermat 平方和定理得证。
考虑两对合,
原命题得证。
最天才!
复数与 Gauss 整数
定义 1:对复数
z = a + b i z=a+bi z = a + bi 定义
ℜ ( z ) = a , ℑ ( z ) = b \Re(z)=a,\Im(z)=b ℜ ( z ) = a , ℑ ( z ) = b 。
引理 1:
∀ a 1 + b 1 i , a 2 + b 2 i ∈ C : a 1 + b 1 i a 2 + b 2 i = a 1 b 1 + a 2 b 2 a 2 2 + b 2 2 + a 2 b 1 − a 1 b 2 a 2 2 + b 2 2 ⋅ i \forall a_1+b_1i,a_2+b_2i\in\Complex:\frac{a_1+b_1i}{a_2+b_2i}=\frac{a_1b_1+a_2b_2}{{a_2}^2+{b_2}^2}+\frac{a_2b_1-a_1b_2}{{a_2}^2+{b_2}^2}\cdot i ∀ a 1 + b 1 i , a 2 + b 2 i ∈ C : a 2 + b 2 i a 1 + b 1 i = a 2 2 + b 2 2 a 1 b 1 + a 2 b 2 + a 2 2 + b 2 2 a 2 b 1 − a 1 b 2 ⋅ i 。
证:
a 1 + b 1 i a 2 + b 2 i = ( a 1 + b 1 i ) ( a 2 − b 2 i ) ( a 2 + b 2 i ) ( a 2 − b 2 i ) = a 1 b 1 + a 2 b 2 + a 2 b 1 i − a 1 b 2 i a 2 2 + b 2 2 = a 1 b 1 + a 2 b 2 a 2 2 + b 2 2 + a 2 b 1 − a 1 b 2 a 2 2 + b 2 2 ⋅ i \begin{aligned}
\frac{a_1+b_1i}{a_2+b_2i}=&\frac{(a_1+b_1i)(a_2-b_2i)}{(a_2+b_2i)(a_2-b_2i)}\\
=&\frac{a_1b_1+a_2b_2+a_2b_1i-a_1b_2i}{{a_2}^2+{b_2}^2}\\
=&\frac{a_1b_1+a_2b_2}{{a_2}^2+{b_2}^2}+\frac{a_2b_1-a_1b_2}{{a_2}^2+{b_2}^2}\cdot i
\end{aligned} a 2 + b 2 i a 1 + b 1 i = = = ( a 2 + b 2 i ) ( a 2 − b 2 i ) ( a 1 + b 1 i ) ( a 2 − b 2 i ) a 2 2 + b 2 2 a 1 b 1 + a 2 b 2 + a 2 b 1 i − a 1 b 2 i a 2 2 + b 2 2 a 1 b 1 + a 2 b 2 + a 2 2 + b 2 2 a 2 b 1 − a 1 b 2 ⋅ i
定义 2:「高斯整数」是
Z [ i : = − 1 ] \Z[i:=\sqrt{-1}] Z [ i := − 1 ] 的元素,即满足
ℜ ( z ) , ℑ ( z ) ∈ Z \Re(z),\Im(z)\in\Z ℜ ( z ) , ℑ ( z ) ∈ Z 的复数
z z z 。
定义 3:高斯整数
z = a + b i z=a+bi z = a + bi 的共轭是
z ‾ = a − b i \overline z=a-bi z = a − bi 。
定义 4:高斯整数的「范数」为
N ( z ) : = ℜ 2 ( z ) + ℑ 2 ( z ) N(z):=\Re^2(z)+\Im^2(z) N ( z ) := ℜ 2 ( z ) + ℑ 2 ( z ) 。
引理 2:
∀ z 1 , z 2 ∈ Z [ i ] : N ( z 1 ) N ( z 2 ) = N ( z 1 z 2 ) \forall z_1,z_2\in\Z[i]:N(z_1)N(z_2)=N(z_1z_2) ∀ z 1 , z 2 ∈ Z [ i ] : N ( z 1 ) N ( z 2 ) = N ( z 1 z 2 ) 。
显然。
引理:
∀ a , b ≠ 0 ∈ Z [ i ] : ∃ q , r ∈ Z [ i ] : a = b q + r , N ( r ) ≤ 1 2 N ( b ) < N ( b ) \forall a,b\neq 0\in\Z[i]:\exists q,r\in\Z[i]:a=bq+r,N(r)\le\frac12N(b)<N(b) ∀ a , b = 0 ∈ Z [ i ] : ∃ q , r ∈ Z [ i ] : a = b q + r , N ( r ) ≤ 2 1 N ( b ) < N ( b ) 。
证:
令
( a b ) C = : x + y i x ′ : = ⌊ x + 1 2 ⌋ y ′ : = ⌊ y + 1 2 ⌋ q : = x ′ + y ′ i \left(\frac ab\right)_\Complex=:x+yi\\
x':=\left\lfloor x+\frac12\right\rfloor\\
y':=\left\lfloor y+\frac12\right\rfloor\\
q:=x'+y'i ( b a ) C =: x + y i x ′ := ⌊ x + 2 1 ⌋ y ′ := ⌊ y + 2 1 ⌋ q := x ′ + y ′ i
则
∣ x − x ′ ∣ , ∣ y − y ′ ∣ ≤ 1 2 r = a − b q = b ( x + y i − q ) = b ( x − x ′ + ( y − y ′ ) i ) |x-x'|,|y-y'|\le\frac12\\
r=a-bq=b(x+yi-q)=b(x-x'+(y-y')i) ∣ x − x ′ ∣ , ∣ y − y ′ ∣ ≤ 2 1 r = a − b q = b ( x + y i − q ) = b ( x − x ′ + ( y − y ′ ) i )
考虑其范数:
N ( r ) = N ( b ) ( ( x − x ′ ) 2 + ( y − y ′ ) 2 ) ≤ 1 2 N ( b ) < N ( b ) N(r)=N(b)((x-x')^2+(y-y')^2)\le\frac12N(b)<N(b) N ( r ) = N ( b ) (( x − x ′ ) 2 + ( y − y ′ ) 2 ) ≤ 2 1 N ( b ) < N ( b )
注意在
2 x ∈ Z 2x\in\Z 2 x ∈ Z 或
2 y ∈ Z 2y\in\Z 2 y ∈ Z 时,取
x ′ = ⌊ x ⌋ x'=\lfloor x\rfloor x ′ = ⌊ x ⌋ 或
y ′ = ⌊ y ⌋ y'=\lfloor y\rfloor y ′ = ⌊ y ⌋ 也是合法的,因此
( q , r ) (q,r) ( q , r ) 不一定唯一。但是我们只要求存在。
推论:
Z [ i ] \Z[i] Z [ i ] 是 Euclid 整环,素元与不可约元等价,具有唯一分解性,最大公因数一定存在。
前面讲了 6kb 的环论就是为了这一句话。
平方分解
定义:对于
a ∈ N a\in\N a ∈ N ,如果
∃ x , y ∈ Z : x 2 + y 2 = a \exists x,y\in\Z:x^2+y^2=a ∃ x , y ∈ Z : x 2 + y 2 = a ,则称
a a a 是「平方分解数」。
引理:一个数是平方分解数当且仅当他能被表示成一对共轭高斯整数的积。
证:
x 2 + y 2 = a ⇔ ( x − y i ) ( x + y i ) = a x^2+y^2=a\Leftrightarrow(x-yi)(x+yi)=a x 2 + y 2 = a ⇔ ( x − y i ) ( x + y i ) = a 。
分解模 4 4 4 余 1 1 1 质数
令
p = : 4 n + 1 p=:4n+1 p =: 4 n + 1 ,本小节的
p p p 默认全部模
4 4 4 余
1 1 1 ,全部字母代表整数。
引理:
∀ p : ∃ ! ∗ 0 < a < b : a 2 + b 2 = p \forall p:\exists!^*0<a<b:a^2+b^2=p ∀ p : ∃ ! ∗ 0 < a < b : a 2 + b 2 = p 。
证:
考虑其等价命题:如果
∃ x , y , u , v ∈ N + , ( x , y ) ≠ ( u , v ) , ( x , y ) ≠ ( v , u ) : x 2 + y 2 = u 2 + v 2 = p \exists x,y,u,v\in\N^+,(x,y)\neq(u,v),(x,y)\neq(v,u):x^2+y^2=u^2+v^2=p ∃ x , y , u , v ∈ N + , ( x , y ) = ( u , v ) , ( x , y ) = ( v , u ) : x 2 + y 2 = u 2 + v 2 = p ,则
p p p 是合数。
( x , y ) , ( u , v ) (x,y),(u,v) ( x , y ) , ( u , v ) 两个数对,每个数对都恰有一奇一偶,不妨设
x , u x,u x , u 偶,
y , v y,v y , v 奇,
x < u x<u x < u 。由于
2 ∣ gcd ( u − x , y − v ) 2\mid\gcd(u-x,y-v) 2 ∣ g cd( u − x , y − v ) 且他们都大于
0 0 0 ,可以设正整数
d : = gcd ( u − x , y − v ) 2 a : = u − x 2 d b : = y − v 2 d d:=\frac{\gcd(u-x,y-v)}2\\
a:=\frac{u-x}{2d}\\
b:=\frac{y-v}{2d} d := 2 g cd( u − x , y − v ) a := 2 d u − x b := 2 d y − v
x 2 + y 2 = u 2 + v 2 u 2 − x 2 = y 2 − v 2 ( u − x ) ( u + x ) = ( y − v ) ( y + v ) 2 a d ( 2 a d + 2 x ) = 2 b d ( 2 b d + 2 v ) a 2 d + a x = b 2 d + b v x^2+y^2=u^2+v^2\\
u^2-x^2=y^2-v^2\\
(u-x)(u+x)=(y-v)(y+v)\\
2ad(2ad+2x)=2bd(2bd+2v)\\
a^2d+ax=b^2d+bv x 2 + y 2 = u 2 + v 2 u 2 − x 2 = y 2 − v 2 ( u − x ) ( u + x ) = ( y − v ) ( y + v ) 2 a d ( 2 a d + 2 x ) = 2 b d ( 2 b d + 2 v ) a 2 d + a x = b 2 d + b v
等号所代表的数同时被
a , b a,b a , b 整除,且
a ⊥ b a\perp b a ⊥ b ,所以可以设正整数
c : = a 2 d + a x a b c:=\frac{a^2d+ax}{ab} c := ab a 2 d + a x
从而
a 2 d + a x = a b c x = a b c − a 2 d a = b c − a d y = 2 b d + v = a c + b d p = x 2 + y 2 = ( b c − a d ) 2 + ( a c + b d ) 2 = ( a 2 + b 2 ) ( c 2 + d 2 ) a^2d+ax=abc\\
x=\frac{abc-a^2d}a=bc-ad\\
y=2bd+v=ac+bd\\
p=x^2+y^2=(bc-ad)^2+(ac+bd)^2=(a^2+b^2)(c^2+d^2) a 2 d + a x = ab c x = a ab c − a 2 d = b c − a d y = 2 b d + v = a c + b d p = x 2 + y 2 = ( b c − a d ) 2 + ( a c + b d ) 2 = ( a 2 + b 2 ) ( c 2 + d 2 )
由
a , b , c , d ∈ N + a,b,c,d\in\N^+ a , b , c , d ∈ N + 推得
p p p 为合数。
下面让我们来构造一组
x , y x,y x , y 使得
x 2 + y 2 = p x^2+y^2=p x 2 + y 2 = p 。
找到 c c c 使得 c 2 ≡ − 1 ( m o d p ) , c < p 2 c^2\equiv -1\pmod p, c<\frac p2 c 2 ≡ − 1 ( mod p ) , c < 2 p (由于 ( − 1 4 k + 1 ) ≡ ( − 1 ) ( 4 k + 1 ) − 1 2 = 1 \left(\frac{-1}{4k+1}\right)\equiv(-1)^{\frac{(4k+1)-1}2}=1 ( 4 k + 1 − 1 ) ≡ ( − 1 ) 2 ( 4 k + 1 ) − 1 = 1 ,所以 a a a 一定存在);
找到一个 a b \frac ab b a ,满足 ∃ k : a b = c p k , a ′ b ′ = c p k + 1 , b ≤ p , b ′ > p \exists k:\frac ab={\frac cp}_{k},\frac{a'}{b'}={\frac cp}_{k+1},b\le\sqrt p, b'>\sqrt p ∃ k : b a = p c k , b ′ a ′ = p c k + 1 , b ≤ p , b ′ > p (这一步可以用连分数渐进分数的递推式),此时 ( b c − p a ) 2 + b 2 = p (bc-pa)^2+b^2=p ( b c − p a ) 2 + b 2 = p 。
正确性证明:
存在性是容易的:最后一个
b b b 一定是
p p p ,
a a a 一开始是
0 0 0 ,由离散介值定理部分的定理 1 知存在性。
根据连分数引理 4,
∃ ϵ ≤ 1 : c p = a b + ϵ b b ′ b c − p a = ϵ p b ′ < ϵ p b 2 < p ( b c − p a ) 2 + b 2 < 2 p 2 ( b c − p a ) 2 + b 2 ≡ b 2 c 2 + b 2 ≡ − b 2 + b 2 ≡ 0 ( m o d p ) p ∣ ( b c − p a ) 2 + b 2 ( b c − p a ) 2 + b 2 = p \exists\epsilon\le1:\frac cp=\frac ab+\frac\epsilon{bb'}\\
bc-pa=\frac{\epsilon p}{b'}<\epsilon\sqrt p\\
b^2<p\\
(bc-pa)^2+b^2<2p^2\\
(bc-pa)^2+b^2\equiv b^2c^2+b^2\equiv-b^2+b^2\equiv0\pmod p\\
p\mid(bc-pa)^2+b^2\\
(bc-pa)^2+b^2=p ∃ ϵ ≤ 1 : p c = b a + b b ′ ϵ b c − p a = b ′ ϵ p < ϵ p b 2 < p ( b c − p a ) 2 + b 2 < 2 p 2 ( b c − p a ) 2 + b 2 ≡ b 2 c 2 + b 2 ≡ − b 2 + b 2 ≡ 0 ( mod p ) p ∣ ( b c − p a ) 2 + b 2 ( b c − p a ) 2 + b 2 = p
一般整数分解与计数
设我们要分解的整数
n = ( a + b i ) ( a − b i ) n=(a+bi)(a-bi) n = ( a + bi ) ( a − bi ) 可以在
N \N N 内质因数分解成
∏ i = 1 k 1 p i α i ⋅ ∏ i = 1 k 2 q i β i ⋅ 2 δ \prod_{i=1}^{k_1}{p_i}^{\alpha_i}\cdot\prod_{i=1}^{k_2}{q_i}^{\beta_i}\cdot2^\delta ∏ i = 1 k 1 p i α i ⋅ ∏ i = 1 k 2 q i β i ⋅ 2 δ ,其中
p i ≡ 1 ( m o d 4 ) , q i ≡ 3 ( m o d 4 ) p_i\equiv1\pmod4,q_i\equiv3\pmod4 p i ≡ 1 ( mod 4 ) , q i ≡ 3 ( mod 4 ) 。
对于每个 p i α i {p_i}^{\alpha_i} p i α i ,他在 Z [ i ] \Z[i] Z [ i ] 中能被分解成相伴意义下唯一的 ( z i z i ‾ ) α i (z_i\overline{z_i})^{\alpha_i} ( z i z i ) α i 。这 α i \alpha_i α i 个 z i z_i z i 可以分配给左边 j ∈ [ 0 , α i ] j\in[0,\alpha_i] j ∈ [ 0 , α i ] 个,相应地给右边 α i − j \alpha_i-j α i − j 个,z i ‾ \overline{z_i} z i 给左边 α i − j \alpha_i-j α i − j 个,给右边 j j j 个,他为方案数贡献 α i + 1 \alpha_i+1 α i + 1 。注意这里交换重复不算重复。
对于每个 q i β i {q_i}^{\beta_i} q i β i ,由 Fermat 平方和定理得他在 Z [ i ] \Z[i] Z [ i ] 中不可分解,我们还要保证 n n n 分解成一对共轭 Gauss 整数,由 Gauss 整数的唯一分解性得只能是左边右边各 β i 2 \frac{\beta_i}2 2 β i 个 q i q_i q i 。当 β i \beta_i β i 为偶数时,他对方案数的贡献为 1 1 1 ,否则为 0 0 0 。
对于 δ \delta δ 个 2 = ( 1 + i ) ( 1 − i ) 2=(1+i)(1-i) 2 = ( 1 + i ) ( 1 − i ) ,由于 1 + i = i ( 1 − i ) 1+i=i(1-i) 1 + i = i ( 1 − i ) ,因此 2 2 2 的所有分法在相伴意义下重复,为答案贡献 1 1 1 。
总方案数还要乘上
Z [ i ] \Z[i] Z [ i ] 的
4 4 4 个可逆元,就是
4 ∏ i = 1 k 1 ( α i + 1 ) ∏ i = 1 k 2 [ β i ≡ 0 ( m o d 2 ) ] 4\prod_{i=1}^{k_1}(\alpha_i+1)\prod_{i=1}^{k_2}[\beta_i\equiv0\pmod2] 4 ∏ i = 1 k 1 ( α i + 1 ) ∏ i = 1 k 2 [ β i ≡ 0 ( mod 2 )] 。构造一组也不难,
p i p_i p i 和
2 2 2 随便分
q i q_i q i 平均分就行。构造全部也不难,把所有分法枚举一遍即可,复杂度最高
O ( f ( n ) + a n s log n ) \Omicron(f(n)+\mathrm{ans}\log n) O ( f ( n ) + ans log n ) ,其中
f f f 是分解质因数的复杂度。这个
a n s \mathrm{ans} ans 的量级我只会压到每当
n n n 放大
5 5 5 倍时对答案的乘数贡献一个不到
2 2 2 ,所以
a n s ≤ 2 log 5 n = n log 2 5 ≈ n 0.4307 \mathrm{ans}\le2^{\log_5n}=n^{\log_25}\approx n^{0.4307} ans ≤ 2 l o g 5 n = n l o g 2 5 ≈ n 0.4307 。
关于那个
f f f ,使用 Pollard-Rho 时
f ( n ) = O ( n 1 4 log n ) f(n)=\Omicron(n^{\frac14}\log n) f ( n ) = O ( n 4 1 log n ) 。然而在无穷的意义下有个复杂度更优的算法:
General Number Field Sieve,广义数域筛 ,其复杂度为
O ( exp ( ( 64 9 ) 1 3 ( ln n ) 1 3 ( ln ln n ) 2 3 ) ) \Omicron\left(\exp\left(\left(\frac{64}9\right)^{\frac13}(\ln n)^{\frac13}(\ln\ln n)^{\frac23}\right)\right) O ( exp ( ( 9 64 ) 3 1 ( ln n ) 3 1 ( ln ln n ) 3 2 ) ) 。由于这玩意大概在
n ≥ exp ( 61.5 ) ≈ 5.63 × 10 28 n\ge\exp(61.5)\approx5.63\times10^{28} n ≥ exp ( 61.5 ) ≈ 5.63 × 1 0 28 时才快于 Pollard-Rho,所以没有引进 OI 中,用处不大,也不像环论那样对关键定理证明产生影响,所以这里不作细讲。
圆周率
χ \chi χ
定义一个函数:
χ ( x ) : = { 1 , x ≡ 1 ( m o d 4 ) 0 , x ≡ 0 ( m o d 2 ) − 1 , otherwise. \chi(x):=
\begin{aligned}\begin{cases}
1,\quad&x\equiv1\pmod4\\
0,\quad&x\equiv0\pmod2\\
-1,\quad&\text{otherwise.}
\end{cases}\end{aligned} χ ( x ) := ⎩ ⎨ ⎧ 1 , 0 , − 1 , x ≡ 1 ( mod 4 ) x ≡ 0 ( mod 2 ) otherwise.
显然他是完全积性函数。
引理 1:相伴意义下不重复的唯一分解数
a n s \mathrm{ans} ans 即为
4 ⋅ ( 1 ∗ χ ) 4\cdot(1\ast\chi) 4 ⋅ ( 1 ∗ χ ) ,其中
1 1 1 是函数值永远为
1 1 1 的函数。
令
x = : ∏ i = 1 k r i θ i x=:\prod_{i=1}^k{r_i}^{\theta_i} x =: i = 1 ∏ k r i θ i
其中
r i r_i r i 是互不相同的质数,那么小学奥数知识告诉我们:
( 1 ∗ χ ) ( x ) = ∏ i = 1 k ∑ j = 0 θ i χ ( r i j ) (1\ast\chi)(x)=\prod_{i=1}^k\sum_{j=0}^{\theta_i}\chi({r_i}^j) ( 1 ∗ χ ) ( x ) = i = 1 ∏ k j = 0 ∑ θ i χ ( r i j )
对于 r i ≡ 1 ( m o d 4 ) r_i\equiv1\pmod4 r i ≡ 1 ( mod 4 ) 的项,他对 a n s ( x ) \mathrm{ans}(x) ans ( x ) 的贡献为 θ i + 1 \theta_i+1 θ i + 1 ,而 ∑ j = 0 θ i χ ( r i θ i ) \sum_{j=0}^{\theta_i}\chi({r_i}^{\theta_i}) ∑ j = 0 θ i χ ( r i θ i ) 正好为 θ i + 1 \theta_i+1 θ i + 1 ;
对于 r i ≡ 3 ( m o d 4 ) r_i\equiv3\pmod4 r i ≡ 3 ( mod 4 ) 的项,当 θ i \theta_i θ i 为偶数时他对答案贡献 1 1 1 ,否则贡献 0 0 0 ,刚好与 ∑ j = 0 θ i χ ( r i θ i ) = 1 − 1 + 1 − 1 … \sum_{j=0}^{\theta_i}\chi({r_i}^{\theta_i})=1-1+1-1\dots ∑ j = 0 θ i χ ( r i θ i ) = 1 − 1 + 1 − 1 … 相等;
对于 r i = 2 r_i=2 r i = 2 ,他对答案贡献 1 1 1 ,与 ∑ j = 0 θ i χ ( r i θ i ) = 1 + 0 + 0 + … \sum_{j=0}^{\theta_i}\chi({r_i}^{\theta_i})=1+0+0+\dots ∑ j = 0 θ i χ ( r i θ i ) = 1 + 0 + 0 + … 相等。
最后
a n s \mathrm{ans} ans 要乘上
4 4 4 ,所以
a n s = 4 ⋅ ( 1 ∗ χ ) \mathrm{ans}=4\cdot(1\ast\chi) ans = 4 ⋅ ( 1 ∗ χ ) 。
π \pi π
半径为
R R R 的圆内整点个数为
π R 2 + O ( R ) ∼ π R 2 \pi R^2+\Omicron(R)\sim\pi R^2 π R 2 + O ( R ) ∼ π R 2 ,其面积
π R 2 \pi R^2 π R 2 在
R → + ∞ R\to+\infty R → + ∞ 时趋近于圆内整点个数。而
R R R 半径的圆内整点个数就是对于每个
i ∈ [ 1 , R 2 ] i\in[1,R^2] i ∈ [ 1 , R 2 ] ,半径为
i i i 的圆上整点个数之和。而圆上整点个数就是刚刚讲到的
a n s ( i ) = 4 ( 1 ∗ χ ) ( i ) \mathrm{ans}(i)=4(1\ast\chi)(i) ans ( i ) = 4 ( 1 ∗ χ ) ( i ) 。所以:
π R 2 ∼ ∑ i = 1 R 2 a n s ( i ) π 4 ∼ 1 R 2 ∑ i = 1 R 2 1 4 a n s ( i ) = 1 R 2 ∑ i = 1 R 2 ∑ d ∣ i χ ( d ) = 1 R 2 ∑ d = 1 R 2 ⌊ R 2 d ⌋ χ ( d ) ∼ ∑ d = 1 R 2 χ ( d ) d = 1 1 + 0 2 − 1 3 + 0 4 + 1 5 + 0 6 − 1 7 + … = 1 1 − 1 3 + 1 5 − 1 7 … \begin{aligned}
\pi R^2\sim&\sum_{i=1}^{R^2}\mathrm{ans}(i)\\
\frac\pi4\sim&\frac1{R^2}\sum_{i=1}^{R^2}\frac14\mathrm{ans}(i)\\
=&\frac1{R^2}\sum_{i=1}^{R^2}\sum_{d\mid i}\chi(d)\\
=&\frac1{R^2}\sum_{d=1}^{R^2}\left\lfloor\frac{R^2}d\right\rfloor\chi(d)\\
\sim&\sum_{d=1}^{R^2}\frac{\chi(d)}{d}\\
=&\frac11+\frac02-\frac13+\frac04+\frac15+\frac06-\frac17+\dots\\
=&\frac11-\frac13+\frac15-\frac17\ldots
\end{aligned} π R 2 ∼ 4 π ∼ = = ∼ = = i = 1 ∑ R 2 ans ( i ) R 2 1 i = 1 ∑ R 2 4 1 ans ( i ) R 2 1 i = 1 ∑ R 2 d ∣ i ∑ χ ( d ) R 2 1 d = 1 ∑ R 2 ⌊ d R 2 ⌋ χ ( d ) d = 1 ∑ R 2 d χ ( d ) 1 1 + 2 0 − 3 1 + 4 0 + 5 1 + 6 0 − 7 1 + … 1 1 − 3 1 + 5 1 − 7 1 …
参考,致谢,以及写在后面
参考与致谢:
这篇文章创建于 2025.02.19,初版完成于 2025.03.28。当时省选模拟出了这么个题:给个整数,构造他的一个平方分解。题解里面只有一堆结论,一个证明没有,但是提到了
P2508 [HAOI2008] 圆上的整点。翻题解翻出来了
那个视频 ,他讲了很多结论,包括高斯整数,
π \pi π 的那个渐进公式,但例如 Gauss 整数的唯一分解性还是感性理解。于是我就去搜资料,搜出来了环论,Fermat 平方和定理等等,但就是没有
4 k + 1 4k+1 4 k + 1 平方分解唯一性及其构造,这篇文章也就扔掉了。一模和 MOer 一起复习(我们学校四科竞赛都在初中部且教室连在一起,但是 OI 由于没有机房所以教室和午休都在高中部,考试午休的时候 OIer 只能四处游荡)的时候听他们聊起二次剩余于是就提出了
4 k + 1 4k+1 4 k + 1 分解唯一性的问题,他把那本书给了我。抱着“要不顺便把构造分解也解决了?”的想法,搜到了
Note de M. Hermite 这一页纸,然后是连分数,行列式,最后把这篇文章写完了。
本人第一次写这么大的文章,也是第一次正经投全站推荐上一次投的休闲娱乐,文章肯定有问题,排版,语言,逻辑等等。还请各位大佬多多指教。