专栏文章

高等代数

个人记录参与者 5已保存评论 5

文章操作

快速查看文章及其快照的属性,并进行相关操作。

当前评论
5 条
当前快照
1 份
快照标识符
@miqs2x98
此快照首次捕获于
2025/12/04 09:49
3 个月前
此快照最后确认于
2025/12/04 09:49
3 个月前
查看原文
本博客基于 wwli 的代数学讲义,结合他在北京大学开设的高等代数课程内容,进行整理得到。你可以在他的 学术主页 获得原稿。应该会随着本人的学习和复习不断更新补充。
按理说向量和矩阵需要加粗以示区分,但本文为了简单起见,并不加粗。

八、双线性形式

定义 8-1:对于域 FFFF 上向量空间 V1,V2,WV_1,V_2,W,考虑线性映射 B:V1×V2WB:V_1\times V_2\rightarrow W,如果它满足以下的双重线性性,则称该线性映射 BB 为双线性映射,其中 i{1,2}i\in\{1,2\}
  • B(vi+vi,)=B(vi,)+B(vi,)B(v_i'+v_i,\cdot)=B(v_i',\cdot)+B(v_i,\cdot)
  • B(tvi,)=tB(vi,)B(tv_i,\cdot)=tB(v_i,\cdot)
记所有满足 B:V1×V2WB:V_1\times V_2\rightarrow W 的双线性映射组成的集合为 Bil(V1,V2;W)\mathrm{Bil}(V_1,V_2;W)。特别地,如果 W=FW=F,则称 BB 为双线性形式。
不难验证,通过逐点运算,可以把 Bil(V1,V2;W)\mathrm{Bil}(V_1,V_2;W) 变为向量空间。
例 8-1-1:矩阵乘法 Mm×n(F)×Mn×k(F)Mm×k(F)\mathrm{M}_{m\times n}(F)\times \mathrm{M}_{n\times k}(F)\rightarrow\mathrm{M}_{m\times k}(F),为双线性映射:
  • (A+B)C=AC+BC(A+B)C=AC+BC
  • (tA)B=t(AB)(tA)B=t(AB)
例 8-1-2VVFF 向量空间,VV^{\lor} 为其对偶空间 Hom(V,F)\mathrm{Hom}(V,F),则定义其典范配对为:
,:V×VF(λ,v)λ(v)\begin{aligned} \langle \cdot,\cdot\rangle:V^{\lor}\times V&\rightarrow F \\ (\lambda,v) &\mapsto \lambda(v) \end{aligned}
不难通过 λ\lambda 是线性映射验证它是双线性形式。
命题 8-1:取 V,WV,WFF 向量空间,则有以下线性同构:
Bil(V,W;F)Hom(V,W)B(vB(v,))Bil(V,W;F)Hom(W,V)B(wB(,w))\begin{aligned} \mathrm{Bil}(V,W;F)&\xrightarrow{\sim} \mathrm{Hom}(V,W^{\lor})\\ B&\mapsto (v\mapsto B(v,\cdot)) \\ \mathrm{Bil}(V,W;F)&\xrightarrow{\sim} \mathrm{Hom}(W,V^{\lor})\\ B&\mapsto (w\mapsto B(\cdot,w)) \end{aligned}
其中反映射分别为:
Hom(V,W)Bil(V,W;F)φ(B(v,w)=φ(w),v)Bil(V,W;F)Hom(W,V)ψ(B(v,w)=ψ(v),w)\begin{aligned} \mathrm{Hom}(V,W^{\lor})&\xrightarrow{\sim} \mathrm{Bil}(V,W;F)\\ \varphi&\mapsto (B(v,w)=\langle \varphi(w),v\rangle) \\ \mathrm{Bil}(V,W;F)&\xrightarrow{\sim} \mathrm{Hom}(W,V^{\lor})\\ \psi&\mapsto (B(v,w)=\langle \psi(v), w \rangle) \end{aligned}
只需分别验证其线性性和合成为 id\rm id 即可。
(注:写这么麻烦是因为我不会打 \mapsto 这东西向左指;如果你学过计算概论(实验班),你会知道这东西是 curry\rm curry 化)
命题 8-2:尝试用矩阵描述双线性形式。取 n,mZ1n,m\in\mathbb{Z}_{\ge 1},则若我们将 FnF^n 内元素视作列向量,我们有以下向量空间的同构:
θ:Mm×n(F)Bil(Fm,Fn;F)A(B(v,w)=tvAw)\begin{aligned} \theta:\mathrm{M}_{m\times n}(F)&\xrightarrow{\sim} \mathrm{Bil}(F^m,F^n;F)\\ A&\mapsto (B(v,w)={}^\mathrm{t}v Aw) \end{aligned}
进一步,如果 ABA\mapsto B,即:
B(i=1mxiei,j=1nyjej)=i=1mj=1naijxiyjB\left(\sum_{i=1}^m x_ie_i,\sum_{j=1}^n y_je_j\right)=\sum_{i=1}^m\sum_{j=1}^n a_{ij}x_iy_j
证明 8-2-1
此为本命题第一个证明。首先,不难验证对所有的 AA,映射到的 B(v,w)=tvAwB(v,w)={}^\mathrm{t}v Aw 是双线性形式,且 θ\theta 为线性映射:
  • θ(A1+A2)(v,w)=tvA1w+tvA2w\theta(A_1+A_2)(v,w)={}^\mathrm{t}v A_1w+{}^\mathrm{t}v A_2w
  • θ(xA)(v,w)=xtvAw,xF\theta(xA)(v,w)=x{}^\mathrm{t}v Aw,x\in F
接着考虑 BB 的求值映射:
Bil(Fm,Fn;F)FmnB(B(ei,ej))ij\begin{aligned} \mathrm{Bil}(F^m,F^n;F)&\rightarrow F^{mn}\\ B&\mapsto (B(e_i,e_j))_{ij} \end{aligned}
根据双重线性性,不难验证:
B(i=1mxiei,j=1nyjej)=i=1mj=1nB(ei,ej)xiyjB\left(\sum_{i=1}^m x_ie_i,\sum_{j=1}^n y_je_j\right)=\sum_{i=1}^m\sum_{j=1}^n B(e_i,e_j)x_iy_j
所以 BB(B(ei,ej))ij(B(e_i,e_j))_{ij} 唯一确定。即上述求值映射是单射。而 Mm×n(F)\mathrm{M}_{m\times n}(F)FmnF^{mn} 同构,所以 θ\theta 即单射。下面需要证明 θ\theta 满,即 kerθ={0}\mathrm{ker}\theta=\{0\}。令 θ(A)=0\theta(A)=0,则 B=0B=0,但 B(ei,ej)=aij=0B(e_i,e_j)=a_{ij}=0(通过定义不难得到),故 A=0A=0。所以 θ\theta 为同构,证毕。
证明 8-2-2
此为本命题第二个较为抽象的证明。考虑命题 8-1 中的同构 Hom(W,V)Bil(V,W;F)\mathrm{Hom}(W,V^{\lor})\xrightarrow{\sim} \mathrm{Bil}(V,W;F),代入 W=Fn,V=FmW=F^n,V=F^m,且 (Fm)(F^m)^{\lor} 通过转置发现是行向量空间,那么不难发现 AMm×n(F)A\in\mathrm{M}_{m\times n}(F) 可以等同于线性映射 φ:Fn(Fm)\varphi:F^n\rightarrow(F^m)^{\lor},映 wwφ(w)=t(Aw)\varphi(w)={}^{\rm t}(Aw)。所以根据同构,我们可以把 φ\varphi 同构到 BB
B(v,w)=φ(w),v=t(Aw)v=twtAv=tvAwB(v,w)=\langle \varphi(w),v \rangle={}^{\rm t}(Aw)v={}^{\rm t}w{}^{\rm t}Av={}^{\rm t}vAw
其中最后一个等式是两边同时取转置,但左边是一个数,所以没有影响。最后,代入 ei,eje_i,e_j 不难验证 B(ei,ej)=aijB(e_i,e_j)=a_{ij},则根据双重线性性,最后一个关于 x,y,ex,y,e 的等式显然。证毕。
这样,我们成功把双线性形式和矩阵对应起来。接下来我们尝试定义双线性形式上的直和。
定义 8-2:对双线性形式:B1:V1×W1F,B2:V2×W2FB_1:V_1\times W_1\rightarrow F,B_2:V_2\times W_2\rightarrow F,定义二者直和:
(B1B2):(V1V2)×(W1W2)F((v1,v2),(w1,w2))B(v1,w1)+B2(v2,w2)\begin{aligned} (B_1\oplus B_2):(V_1\oplus V_2)\times (W_1\oplus W_2)&\rightarrow F\\ ((v_1,v_2),(w_1,w_2))&\mapsto B(v_1,w_1)+B_2(v_2,w_2) \end{aligned}
不难验证直和仍然是双线性形式。从矩阵的角度看,将 Vi,WiV_i,W_i 分别看作 Fmi,FniF^{m_i},F^{n_i}BiB_i 看作 AiMmi×ni(F)A_i\in\mathrm{M}_{m_i\times n_i}(F),其中 i{1,2}i\in\{1,2\},则 B1B2B_1\oplus B_2 可以与分块对角矩阵:
(A100A2)\begin{pmatrix} A_1&0\\ 0&A_2 \end{pmatrix}
对应。不妨通过定义展开即可验证。
定义 8-3:对双线性形式 B:V×VFB:V\times V\rightarrow F
  • B(v,w)=B(w,v)B(v,w)=B(w,v),则称 BB 为对称的。
  • B(v,w)=B(w,v)B(v,w)=-B(w,v),则称 BB 为反对称的。
对矩阵 AMn×nA\in\mathrm{M}_{n\times n}
  • A=tAA={}^{\rm t}A,则称其为对称矩阵
  • A=tAA=-{}^{\rm t}A,则称其为反对称矩阵。
B(v,v)=0B(v,v)=0,则它类似行列式的交错形式,故其为反对称的。
对定义展开后,因为我们有(回忆证明 8-2-2):
twtAv=tvAw{}^{\rm t}w{}^{\rm t}Av={}^{\rm t}vAw
故自然矩阵和双线性形式的对称性是一一对应的。
定义 8-4:对双线性形式 B:V×WFB:V\times W\rightarrow F
  • BB 的左根定义为 {vVB(v,)=0}\{v\in V\vert B(v,\cdot)=0\}
  • BB 的右根定义为 {wWB(,w)=0}\{w\in W\vert B(\cdot,w)=0\}
V=WV=W,且 BB 对称或反对称,显然左根等于右根,统称为根基。不难验证根是子空间。
下设 V,WV,W 有限维,则我们称 BB 非退化,若其左右根均为 {0}\{0\}
例 8-4-1
考虑 VV 的典范配对
,:V×VF(λ,v)λ(v)\begin{aligned} \langle\cdot,\cdot\rangle:V^{\lor}\times V&\rightarrow F\\ (\lambda,v)\mapsto \lambda(v) \end{aligned}
则其:
  • 左根为 {λVλ,=0}={0}\{\lambda\in V^{\lor}|\langle\lambda,\cdot\rangle=0\}=\{0\}
  • 右根为 {vV,v=0}\{v\in V|\langle\cdot,v\rangle=0\}
v0\exist v\ne 0 在右根中,则将其扩张为 VV 的基 (v1=v,v2,,vn)(v_1=v,v_2,\cdots,v_n),和其对应的对偶基 v1,,vnv_1^{\lor},\cdots,v_n^{\lor},则 v1,v=1\langle v_1^{\lor},v\rangle=1,矛盾。故右根为 {0}\{0\}。所以典范配对非退化。
例 8-4-2
考虑迹形式:
End(V)×End(V)F(S,T)Tr(ST)\begin{aligned} \mathrm{End}(V)\times\mathrm{End}(V)&\rightarrow F\\ (S,T)&\mapsto \mathrm{Tr}(ST) \end{aligned}
Tr(ST)=Tr(TS)\mathrm{Tr}(ST)=\mathrm{Tr}(TS),故迹形式对称。考虑 SS\in 根基,则我们选一组基将线性映射改为 Mn×n(F)\mathrm{M}_{n\times n}(F) 进行计算,则即:
1i,jn,Tr(AEi,j)=0\forall 1\le i,j\le n,\mathrm{Tr}(AE_{i,j})=0
其中 Ei,jE_{i,j} 为标准基。则上式等价于 aij=0a_{ij}=0。故 A=0A=0,即根基为 {0}\{0\}。所以迹形式非退化。
对双线性形式 B:V×WFB:V\times W\rightarrow F 以及 φHom(W,V),ψHom(V,W)\varphi\in\mathrm{Hom}(W,V^{\lor}),\psi\in\mathrm{Hom}(V,W^{\lor}),有:
  • B(v,)=0    ψ(v),=0B(v,\cdot)=0\iff\langle\psi(v),\cdot\rangle=0,即左根为 kerψ\mathrm{ker}\psi
  • B(w)=0    φ(w),=0B(\cdot,w)=0\iff\langle\varphi(w),\cdot\rangle=0,即左根为 kerφ\mathrm{ker}\varphi
命题 8-3:若 V,WV,W 有限维,则存在非退化双线性形式 B:V×WFB:V\times W\rightarrow F 可以推出 dimV=dimW\dim V=\dim W
证明 8-3
否则若 dimV>dimW\dim V>\dim Wdimkerψ=dimVrkψdimVdimW>0\dim\ker \psi=\dim V-\mathrm{rk}\psi\ge \dim V-\dim W>0,故 BB 退化。
其中 rkψmin(dimV,dimW)=dimW\mathrm{rk}\psi\le \min(\dim V,\dim W^{\lor})=\dim W
命题 8-4:若 dimV=dimW\dim V=\dim W 有限,B:V×WFB:V\times W\rightarrow F 双线性,则下列说法等价:
  1. BB 非退化。
  2. BB 左根为 {0}\{0\}
  3. BB 右根为 {0}\{0\}
证明 8-4
显然 (1)(1) 立刻推出 (2)(2)(3)(3)。下证 (2)(1)(2)\Rightarrow (1),而 (3)(1)(3)\Rightarrow(1) 是类似的。
(2)(2) 成立,故 ψ:VW\psi:V\rightarrow W^{\lor} 为单射,又 dimV=dimW\dim V=\dim W^{\lor},其自动为同构。若存在 wWw\in W 在右根中,即 ψ(v)\psi(v) 总属于 WW^{\lor} 的一个子空间:
w={λWλ(v)=0}{}^{\bot}\langle w \rangle=\{\lambda\in W^{\lor}|\lambda(v)=0\}
w0w\ne0,则 w{}^{\bot}\langle w \rangleWW^{\lor} 的真子集。只需要取 ww 扩展为的基和其对偶基,自动有 www^{\lor}\notin {}^{\bot}\langle w \rangle,故 imψ\mathrm{im}\psiWW^{\lor} 的真子集,与其同构性矛盾。故 BB 右根为 {0}\{0\}(1)(1) 自动成立。
定义 8-5 :对于二元组 (V,B)(V,B),其中 VVFF 向量空间,B:V×VFB:V\times V\rightarrow F 双线性形式,从 (V1,B1)(V_1,B_1)(V2,B2)(V_2,B_2) 的同构为满足以下条件的线性映射 φHom(V1,V2)\varphi\in\mathrm{Hom}(V_1,V_2)
  • φ:V1V2\varphi:V_1\xrightarrow{\sim}V_2,为向量空间同构。
  • B2(φ(v),φ(v))=B1(v,v)B_2(\varphi(v),\varphi(v'))=B_1(v,v')
若存在这样的映射,则称二者同构,记作 (V1,B1)(V2,B2)(V_1,B_1)\simeq(V_2,B_2)。不难验证其给出了一组等价关系,只需构造 idV\mathrm{id}_V,同构合成,同构的逆即得反身,传递和对称性。显然它给出了一个等价类:
{(V,B)dimV=n}/1:1{(Fn,B)}/,BAMn×n(F)\{(V,B)|\dim V=n\}_{/\simeq}\xrightarrow{1:1}\{(F^n,B)\}_{/\simeq},B\leftrightarrow A\in\mathrm{M}_{n\times n}(F)
定义 8-6:矩阵 A,AMn×n(F)A,A'\in\mathrm{M}_{n\times n}(F) 是合同的,若存在一个可逆的 CMn×n(F)C\in\mathrm{M}_{n\times n}(F),使得:
A=tCACA={}^{\rm t}CA'C
记作 ACAA\overset{C}{\sim} A',不难验证其是等价关系。注意合同保持对称性。
命题 8-5B,B:Fn×FnFB,B':F^n\times F^n\rightarrow F 双线性,对应到 A,AMn×n(F)A,A'\in\mathrm{M}_{n\times n}(F),则:
{CACA}1:1{φ(φ:(Fn,B)(Fn,B))}C(FnFn)\begin{aligned} \{C|A\overset{C}{\sim} A'\}&\overset{1:1}{\longleftrightarrow}\{\varphi| (\varphi: (F^n,B)\rightarrow (F^n,B'))\}\\ C&\mapsto (F^n\xrightarrow{\sim} F^n) \end{aligned}
其中 φ\varphi 是同构。不难发现,若 AA 合同 AA',则显然有 (Fn,B)(Fn,B)(F^n,B)\simeq (F^n,B')
证明 8-5
同构 FnFnF^n\xrightarrow{\sim} F^n 对应一个可逆的 CMn×n(F)C\in\mathrm{M}_{n\times n}(F)
B(Cv1,Cv2)=t(Cv1)A(Cv2)=tv1(tCAC)v2=tv1Av2=B(v1,v2)\begin{aligned} B'(Cv_1,Cv_2)&={}^{\rm t}(Cv_1)A'(Cv_2)\\ &={}^{\rm t} v_1({}^{\rm t}CA'C)v_2\\ &={}^{\rm t}v_1Av_2\\ &=B(v_1,v_2) \end{aligned}
CCφ\varphi 是一一对应的。证毕。
下设 CharF2\mathrm{Char}_F\ne 2,否则乘除 22 会出问题。考虑对称双线性形式 V×VFV\times V\rightarrow F,其中 VV 有限维,对 VV 选定一组有序基,使得其变为 FnF^n
定义 8-7:定义 nn 元二次型为齐次二次多项式 fF[X1,,Xn]f\in\mathrm{F}[X_1,\cdots,X_n],其中:
f=iaiiXi2+2i<jaijXiXj,aijFf=\sum_i a_{ii}X_i^2+2\sum_{i<j}a_{ij}X_iX_j,a_{ij}\in F
若我们假设 i,j,aij=aji\forall i,j,a_{ij}=a_{ji},则 ff 还可以表示为:
f=i,jai,jXiXjf=\sum_{i,j}a_{i,j}X_iX_j
则存在三个结构的一一对应关系:
{ff 为 n 元二次型}1:1{AMn×n(F)tA=A}1:1{B:Fn×FnFB 为对称双线性形式}\{f|f\ \text{为}\ n\ \text{元二次型}\}\overset{1:1}\longleftrightarrow\{A\in\mathrm{M}_{n\times n}(F)|{}^{\rm t}A=A\}\overset{1:1}\longleftrightarrow\{B:F^n\times F^n\rightarrow F|B\ \text{为对称双线性形式}\}
其中第一个映射直接令 A=(ai,j)i,jA=(a_{i,j})_{i,j} 即可,第二个映射即 B(ei,ej)=ai,jB(e_i,e_j)=a_{i,j}
vFn=(x1xn)v\in F^n=\begin{pmatrix}x_1\\\vdots\\ x_n\end{pmatrix},定义 f(v)f(v) 为:
f(v)=i,jaijxixj=B(v,v)f(v)=\sum_{i,j}a_{ij}x_ix_j=B(v,v)
命题 8-6:按上述定义有:
B(v1,v2)=12(f(v1+v2)f(v1)f(v2))B(v_1,v_2)=\dfrac{1}{2}(f(v_1+v_2)-f(v_1)-f(v_2))
所以 ff 或其对应的 AA 矩阵,BB 双线性形式,由以下求值映射唯一确定:
FnFvf(v)\begin{aligned} F^n&\rightarrow F\\ v&\mapsto f(v) \end{aligned}
证明 8-6
只需注意到:
f(v1+v2)=B(v1+v2,v1+v2)=B(v1,v1)+B(v2,v2)+2B(v1,v2)=f(v1)+f(v2)+2B(v1,v2)\begin{aligned} f(v_1+v_2)&=B(v_1+v_2,v_1+v_2)\\ &=B(v_1,v_1)+B(v_2,v_2)+2B(v_1,v_2)\\ &=f(v_1)+f(v_2)+2B(v_1,v_2) \end{aligned}
其中利用 BB 的双重线性性和对称性。
但一般的多项式不由求值映射唯一确定!甚至一般的二次型都并不唯一确定。考虑取 F=F2,A=(0110)F=\mathbb{F}_2,A=\begin{pmatrix}0&1\\1&0\end{pmatrix},则:
(xy)(0110)(xy)=2xy=0\begin{pmatrix}x&y\end{pmatrix}\begin{pmatrix}0&1\\1&0\end{pmatrix}\begin{pmatrix}x\\y\end{pmatrix}=2xy=0
F2\mathbb{F}_2 中恒为 00,但 AA 本身并非零矩阵。
定义 8-8:对 VV 有限维 FF 向量空间,B:V×VFB:V\times V\rightarrow F 对称双线性形式,此时将二元组 (V,B)(V,B) 成为域 FF 上的二次型,实现在空间 VV 上,也可以等价的用 (V,f)(V,f) 描述,其中 f=B(v,v)f=B(v,v)
无非是上述命题的另一种描述。
命题 8-7:二次型 f,ff,f' 对应的双线性形式为 B,BB,B',则 (Fn,B)(Fn,B)(F^n,B)\simeq (F^n,B'),当且仅当 f,ff,f' 可以通过一次可逆的线性变量替换相互转化,此时我们称 f,ff,f' 同构。
证明 8-7
(Fn,B)(Fn,B)(F^n,B)\simeq (F^n,B') 即等价于其对应的 A,AA,A' 合同,存在一个可逆 n×nn\times n 矩阵 CC 满足:
A=tCACA={}^{\rm t}CA'C
接着考虑 f(v)=B(v,v)f(v)=B(v,v) 的值 tvAv{}^{\rm t}vAv
f(v)=(x1,,xn)tA(x1xn)=(x1,,xn)tCAC(x1xn)=t(C(x1xn))A(C(x1xn))=f(v)\begin{aligned} f(v)=&\begin{pmatrix}x_1,\cdots,x_n\end{pmatrix}{}^{\rm t}A\begin{pmatrix}x_1\\\vdots\\ x_n\end{pmatrix}\\ =&\begin{pmatrix}x_1,\cdots,x_n\end{pmatrix}{}^{\rm t}CA'C\begin{pmatrix}x_1\\\vdots\\ x_n\end{pmatrix}\\ =&{}^{\rm t}\left(C \begin{pmatrix}x_1\\\vdots\\ x_n\end{pmatrix} \right) A' \left( C \begin{pmatrix}x_1\\\vdots\\ x_n\end{pmatrix} \right)\\ =& f'(v') \end{aligned}
其中 v=(y1yn)v'=\begin{pmatrix}y_1\\\vdots\\ y_n\end{pmatrix}
(y1yn)=C(x1xn),yi=j=1ncijxj\begin{pmatrix}y_1\\\vdots\\ y_n\end{pmatrix}=C\begin{pmatrix}x_1\\\vdots\\ x_n\end{pmatrix},y_i=\sum_{j=1}^n c_{ij}x_j
(Fn,B)(Fn,B)(F^n,B)\simeq (F^n,B') 等价于 f,ff,f' 可以通过一次可逆的线性变量替换相互转化,这个线性替换对应的矩阵即为 CC
下面的讨论依然有 CharF2\mathrm{Char}_F\ne 2,我们来讨论对二次型应用配方。
命题 8-8:任何二次型均同构于以下形式:
a1X12++anXn2a_1X_1^2+\cdots+a_nX_n^2
即若干一维的双线性形式的直和。
例子 8-8:比如有 F=Q,n=3F=\mathbb{Q},n=3,则 我们有:
f(X,Y,Z)=5X2+6Y2+4Z24XY4YZ=5X2+5Y2+(2ZY)24XY5X2+5Y2+Z24XY(Z:=2ZY)=5(X245XY+Y2)+Z2=5((X25Y)2+2125Y2)+Z2=5(X25Y)2+215Y2+Z25X2+215Y2+Z2(X:=X25Y)\begin{aligned} f(X,Y,Z)&=5X^2+6Y^2+4Z^2-4XY-4YZ\\ &=5X^2+5Y^2+(2Z-Y)^2-4XY\\ &\simeq 5X^2+5Y^2+Z^2-4XY(Z:=2Z-Y) \\ &=5\left(X^2-\frac{4}{5}XY+Y^2\right)+Z^2\\ &=5\left(\left(X-\frac{2}{5}Y\right)^2+\dfrac{21}{25}Y^2\right)+Z^2\\ &=5\left(X-\frac{2}{5}Y\right)^2+\frac{21}{5}Y^2+Z^2\\ &\simeq 5X^2+\frac{21}{5}Y^2+Z^2\left(X:=X-\frac{2}{5}Y\right) \end{aligned}
证明 8-8
考虑归纳法,n=1n=1 时问题平凡。下设 n2n\ge 2 且存在 aij0a_{ij}\ne 0,否则问题平凡。
第一种情况,如果存在 ii 使得 aii0a_{ii}\ne 0。不妨将变量重排使得 i=1i=1,则:
f=a11(X1+1a11j=2na1jXj)2+2i,jnaijXiXj1a11(j=2na1jXj)2f=a_{11}\left(X_1+\frac{1}{a_{11}}\sum_{j=2}^n a_{1j}X_j\right)^2+\sum_{2\le i,j\le n}a_{ij}X_iX_j-\dfrac{1}{a_{11}}\left(\sum_{j=2}^n a_{1j}X_j\right)^2
做一次换元:
Yi={X1+1a11j=2na1jXji=1Xii>1Y_i=\begin{cases} X_1+\dfrac{1}{a_{11}}\sum_{j=2}^n a_{1j}X_j&i=1\\ X_i&i>1 \end{cases}
显然线性可逆,不难写出其逆变换。则 ff 变为:
f=a11Y12+gf=a_{11}Y_1^2+g
其中 gg 是关于 Y2,,YnY_2,\cdots,Y_n 的二次型,对其施归纳法即得原命题成立。
第二种情况,如果所有对角线元素均为 00,考虑找到 i<ji<j 使得 aij0a_{ij}\ne 0。则我们取:
Yk={XiXjk=iXkkiY_k=\begin{cases} X_i-X_j & k=i\\ X_k & k\ne i \end{cases}
不难验证其线性可逆。然后我们有:
12f=k<hakhXkXh=k<h,k,hiakhXkXh+i<haih(Yi+Yj)Yh+k<iakiYk(Yi+Yj)\begin{aligned} \frac{1}{2}f&=\sum_{k<h}a_{kh}X_kX_h\\ &=\sum_{k<h,k,h\ne i}a_{kh}X_kX_h+\sum_{i<h} a_{ih}(Y_i+Y_j)Y_h+\sum_{k<i}a_{ki}Y_k(Y_i+Y_j) \end{aligned}
显然只有 aija_{ij} 项对 Yj2Y_j^2 做贡献,故 12f\dfrac{1}{2}f 可以归约到上一种情况计算。证毕
实际上,如果我们想要 ff 对角化(即完成上述同构),考虑将它转化为对称 n×nn\times n 矩阵 AA,则由于任何可逆矩阵 CC 都可以表示为若干初等矩阵的乘积,所以实际上我们是在找一列初等矩阵 (U1,,Uk)(U_1,\cdots,U_k) 使得:
t(U1Uk)A(U1Uk){}^{\rm t}(U_1\cdots U_k)A(U_1\cdots U_k)
也即:
tUktU1AU1Uk{}^{\rm t} U_k\cdots {}^{\rm t}U_1AU_1\cdots U_k
实际上就是先做一列初等变换,再将其行列交换再反过来做一遍。
定义 8-9f=a1X12++arXr2f=a_1X_1^2+\cdots+a_rX_r^2,其中 1rn,aiF×=F\{0}1\le r\le n,a_i\in F^{\times}=F\backslash\{0\},则其对应的矩阵即:
(a1ar)\begin{pmatrix} a_1&&&&&\\ &\ddots&&&&\\ && a_r&&&\\ \\ \\ \end{pmatrix}
留空为 0。定义 ff 的秩 rkf=ndimV=r\mathrm{rk} f=n-\dim V=r,其中 VV 表示对应双线性形式的根基。则双线性形式非退化,当且仅当 r=nr=n
命题 8-9
考虑 FF 为代数闭域,如 C\mathbb C。则有以下结论:
  1. f\forall f,其均同构于 X12++Xr2X_1^2+\cdots+X_r^2,其中 0rn0\le r\le n
{ff 为 n 元二次型}/1:1{0,1,,n}frkf\begin{aligned} \{f|f\ \text{为}\ n\ \text{元二次型}\}_{/\simeq}&\overset{1:1}\longleftrightarrow \{0,1,\cdots,n\}\\ f&\mapsto \mathrm{rk}f \end{aligned}
证明 8-9
我们已知:
fa1X12+arXr,aiF×f\simeq a_1X_1^2+\cdots a_rX_r,a_i\in F^{\times}
而由于是代数闭域,所以存在 biFb_i\in F,使得 ai=bi2a_i=b_i^2,则我们令:
Yi={biXiirXii>rY_i=\begin{cases} b_iX_i&i\le r\\ X_i&i>r \end{cases}
则:
fY12++Yr2f\simeq Y_1^2+\cdots +Y_r^2
(1)(1) 得证。
考虑 (2)(2) 映射的满性,对所有 rr,一定有:
rk(X12++Xr2)=r\mathrm{rk}(X_1^2+\cdots+X_r^2)=r
考虑单性,给定 f,ff,f' 分别同构于 X12++Xr2,X12++Xr2X_1^2+\cdots+X_r^2,X_1^2+\cdots+X_{r'}^2,则:
rkf=rkfr=rf=f\mathrm{rk}f=\mathrm{rk}f'\Rightarrow r=r' \Rightarrow f=f'
故原映射为同构。(2)(2) 得证。
接下来我们考虑在实数域上定义的二次型,此时平方根不一定存在。取 nZ1n\in \mathbb{Z}_{\ge 1},且 fa1X12++arXr2,aiR×,0r=rkfnf\simeq a_1X_1^2+\cdots+a_rX_r^2,a_i\in \mathbb{R}^{\times},0\le r=\mathrm{rk} f\le n。我们令:
Yi={aiXiirXii>rY_i=\begin{cases} \sqrt{|a_i|}X_i&i\le r\\ X_i&i>r \end{cases}
适当重排后,我们有:
fX12++Xp2Xp+12Xr2,0prnf\simeq X_1^2+\cdots+X_p^2-X_{p+1}^2-\cdots-X_r^2,0\le p\le r\le n
定义 8-10:对 R\mathbb R 上线性空间 VV 和对称双线性形式 B:V×VRB:V\times V\rightarrow \mathbb R,我们有如下定义,若 v0\forall v\ne 0
  • B(v,v)0B(v,v)\ge 0,则称 BB 半正定。
  • B(v,v)>0B(v,v)> 0,则称 BB 正定。
  • B(v,v)0B(v,v)\le 0,则称 BB 半负定。
  • B(v,v)<0B(v,v)< 0,则称 BB 负定。
  • 否则,称 BB 不定。
V0VV_0\subset V 子空间,若 BV0×V0B|_{V_0\times V_0} 正定,则称 V0V_0 为正定子空间,其余几种情况类似定义。
命题 8-10:对有限维 VV,若 BB 正定或负定,则 BB 非退化。
证明 8-10
否则取根基内 v0v\ne 0,则 B(v,v)=0B(v,v)=0,矛盾。
命题 8-11
X12++Xp2Xp+12Xr2X_1^2+\cdots+X_p^2-X_{p+1}^2-\cdots-X_r^2
  • 半正定     p=r\iff p=r
  • 正定     p=n\iff p=n
对于负的情况,考虑 f-f
证明 8-11
对实数域,我们有 a12++as20a_1^2+\cdots+a_s^2\ge 0,且等号成立当且仅当 ai=0,ia_i=0,\forall i
命题 8-12:惯性定理:
{(p,r)Z020prn}1:1{n 元实二次型}/(p,r)X12++Xp2Xp+12Xr2\begin{aligned} \{(p,r)\in\mathbb{Z}_{\ge 0}^2|0\le p\le r\le n\}&\overset{1:1}\longleftrightarrow \{n\ \text{元实二次型}\}_{/\simeq}\\ (p,r)&\mapsto X_1^2+\cdots+X_p^2-X_{p+1}^2-\cdots-X_r^2 \end{aligned}
左侧可以等价于 {(p,q)Z02p+qn}\{(p,q)\in\mathbb{Z}_{\ge 0}^2|p+q\le n\},其中 pp 称为正惯性质数,qq 称为负惯性质数。
引理 8-12:有 (V,B)(Rn,X12++Xp2)(V,B)\simeq (\mathbb{R}^n,X_1^2+\cdots+X_p^2-\cdots),则:
  1. 存在正定子空间,其 dim=p\dim=p
  2. 任何子空间,若维数大于 pp,则非正定。
引理证明 8-12
(1)(1),取 V0=e1,,epV_0=\langle e_1,\cdots,e_p\rangle,其中 eie_i 为标准基,显然正定。
(2)(2),取 V1V=Rn,dimV1>pV_1\subset V=\mathbb{R}^n,\dim V_1>p,设 N=ep+1,,enN=\langle e_{p+1},\cdots,e_n \rangle。则:
dim(V1N)=dimV1+dimNdim(V1+N)>n+p+np=0\dim(V_1\cap N)=\dim V_1+\dim N-\dim(V_1+N)>-n+p+n-p=0
v1V1N,v10v_1\in {V_1\cap N},v_1\ne 0,则 f(v1)=B(v1,v1)0f(v_1)=B(v_1,v_1)\le 0,故 V1V_1 非正定。
证明 8-12
满性已知。
下证单性。若 (V,B)φ(V,B),dimV=n (V,B) \overset{\varphi}\simeq (V',B'),\dim V=n,对 V,VV,V' 选定一组有序基,则其对应的对称矩阵对角元为:
1,,1,p1,,1,rp0,,0nr1,,1,p1,,1,rp0,,0nr\begin{aligned} \begin{matrix}\underbrace{1,\cdots,1,}\\p\end{matrix}\begin{matrix}\underbrace{-1,\cdots,-1,}\\r-p\end{matrix}\begin{matrix}\underbrace{0,\cdots,0}\\n-r\end{matrix}\\ \begin{matrix}\underbrace{1,\cdots,1,}\\p'\end{matrix}\begin{matrix}\underbrace{-1,\cdots,-1,}\\r-p'\end{matrix}\begin{matrix}\underbrace{0,\cdots,0}\\n-r\end{matrix} \end{aligned}
其中 r=rk(B)=rk(B)r=\mathrm{rk}(B)=\mathrm{rk}(B')
不妨设 p>pp'>p,则根据引理,我们找到一个正定子空间 V+V,dimV+=pV_+'\subset V',\dim V_+'=p',则 φ1(V+)V\varphi^{-1}(V_+')\subset V 亦为正定子空间,但 dimφ1(V+)=p>p\dim\varphi^{-1}(V_+')=p'>p,矛盾。
p=pp'=p,单性得证。故上述映射为同构。
定义 8-11:选定域 FF,双线性形式 Bi:Vi×ViF(i{1,2})B_i:V_i\times V_i'\rightarrow F(i\in\{1,2\})B1B_1 非退化,Vi,ViV_i,V_i' 有限维,则:
  • THom(V1,V2)T\in\mathrm{Hom}(V_1,V_2),存在唯一的 THom(V2,V1)T^{\ast}\in\mathrm{Hom}(V_2',V_1') 使得: B2(Tv1,v2)=B1(v1,Tv2) B_2(Tv_1,v_2')=B_1(v_1,T^{\ast}v_2') TT^{\ast} 称为 TT 的右伴随。
  • THom(V1,V2)T\in\mathrm{Hom}(V_1',V_2'),存在唯一的 THom(V2,V1){}^{\ast}T\in\mathrm{Hom}(V_2,V_1) 使得: B2(v2,Tv1)=B1(Tv2,v1) B_2(v_2,Tv_1')=B_1({}^{\ast}Tv_2,v_1') T{}^{\ast}T 称为 TT 的左伴随。
证明 8-11:我们来具体刻画一下伴随。
首先来看右伴随,考虑对 Vi,ViV_i,V_i' 选定一组有序基,则有 BiAiMn×n(F)B_i\longleftrightarrow A_i\in\mathrm{M}_{n\times n}(F)TT 看作一个矩阵。则:
B2(Tv1,v2)=t(Tv1)A2v2=tv1tTA2v2=tv1A1(A11 tTA2)v2\begin{aligned} B_2(Tv_1,v_2')&={}^{\rm t}(Tv_1)A_2v_2'\\ &={}^{\rm t}v_1{}^{\rm t}TA_2v_2'={}^{\rm t}v_1A_1(A_1^{-1}\ {}^{\rm t}T A_2)v_2' \end{aligned}
其中取 A1A_1 的逆是合法的,因为 B1B_1 非退化。与 B1(v1,Tv2)=tv1A1Tv2B_1(v_1,T^{\ast}v_2')={}^{\rm t}v_1A_1T^{\ast}v_2' 对比可以发现:
T=A11 tTA2T^{\ast}=A_1^{-1}\ {}^{\rm t}TA_2
类似的对左伴随考虑。
B2(v2,Tv1)=tv2A2Tv1=tv2(A2TA11)A1v1\begin{aligned} B_2(v_2,Tv_1')&={}^{\rm t}v_2A_2Tv_1'\\ &={}^{\rm t}v_2(A_2TA_1^{-1})A_1v_1' \end{aligned}
B1(Tv2,v1)=t(Tv2)A1v1=tv2t(T)A1v1B_1({}^{\ast}Tv_2,v_1')={}^{\rm t}({}^{\ast}Tv_2)A_1v_1={}^{\rm t}v_2{}^{\rm t}({}^{\ast}T)A_1v_1' 对比可以发现:
T=t(A2TA11)=tA11 tT tA2{}^{\ast}T={}^{\rm t}(A_2TA_1^{-1})={}^{\rm t}A_1^{-1}\ {}^{\rm t}T\ {}^{\rm t}A_2
B1,B2B_1,B_2 均非退化,则我们有:(T)=T=(T)({}^{\ast} T)^{\ast}=T={}^{\ast}(T^{\ast})。只需要在双线性形式中把 TT 向左向右各移动一次移动回来即可。
我们有:(ST)=TS,(ST)=TS(ST)^{\ast}=T^{\ast}S^{\ast},{}^{\ast}(ST)={}^{\ast}T{}^{\ast}S。只需要把 S,TS,T 分别移动到另一边即可。
B1,B2B_1,B_2 均非退化,则 rk(T)=rk(T)=rk(T)\mathrm{rk}(T)=\mathrm{rk}(T^{\ast})=\mathrm{rk}({}^{\ast}T)。考虑到 TT 变到其伴随的时候只乘了可逆矩阵和做了转置即可。
V1=V2=V1=V2=V,B1=B2=B,TEnd(V)V_1=V_2=V_1'=V_2'=V,B_1=B_2=B,T\in\mathrm{End}(V)BB 非退化,(反)对称,则 T=T{}^{\ast}T=T^{\ast}。只需要验证定义即可。
定义 8-12TEnd(V)T\in\mathrm{End}(V)B1=B2B_1=B_2 非退化,(反)对称,则我们:
  • TT 自伴,若 T=TT^{\ast}=T
  • 称 $$T 反自伴,若 T=TT^{\ast}=-T
考虑上述的一个特例。取 A=1n×nA=1_{n\times n}TEnd(Fn)Mn×n(F)T\in\mathrm{End}(F^n)\simeq\mathrm{M}_{n\times n}(F),则:
  • TT 自伴,等价于 TT 作为矩阵对称。
  • TT 反自伴,等价于 TT 作为矩阵反对称。
定义 8-13:考虑非退化双线性形式 B:V×WFB:V\times W\rightarrow FdimV=dimW\dim V=\dim W 均有限,则:
  • V0VV_0\subset V 为子空间,定义 V0={wWB(v0,w)=0,v0V0}V_0^{\bot}=\{w\in W|B(v_0,w)=0,\forall v_0\in V_0\}
  • W0WW_0\subset W 为子空间,定义 W0={vVB(v,w0)=0,w0W0}{}^{\bot}W_0=\{v\in V|B(v,w_0)=0,\forall w_0\in W_0\}
由线性性,不难看出 V0,W0V_0^{\bot},{}^{\bot}W_0 分别为 W,VW,V 的子空间。
命题 8-13:有以下等式成立:
dimV0+dimV0=dimV=dimW=dimW0+dimW0\dim V_0^{\bot}+\dim V_0=\dim V=\dim W=\dim W_0+\dim {}^{\bot}W_0
引理 8-13dimW\dim W 有限,w1,,wdWw_1^{\lor},\cdots,w_d^{\lor}\in W^{\lor} 线性无关,定义 w1,,wd{}^{\bot}\langle w_1^{\lor},\cdots,w_d^{\lor} \rangle 为:
{wWwi,wW=0,i}W\{w\in W|\langle w_i^{\lor},w \rangle _W=0,\forall i\}\subset W
dimw1,,wd=dimWd\dim{}^{\bot}\langle w_1^{\lor},\cdots,w_d^{\lor} \rangle=\dim W-d
引理证明 8-13
d=nd=nw1,,wnw_1^{\lor},\cdots,w_n^{\lor}WW^{\lor} 的基,根据典范配对 ,W\langle,\rangle _W 非退化,则 w1,,wd={0}{}^{\bot}\langle w_1^{\lor},\cdots,w_d^{\lor} \rangle=\{0\}
d=1d=1 时,w10w_1^{\lor}\ne 0w1=ker(w1:WF){}^{\bot}\langle w_1^{\lor}\rangle=\ker(w_1^{\lor}:W\rightarrow F)。根据像和核的关系:
dimw1=dimWdimF=n1\dim{}^{\bot}\langle w_1^{\lor} \rangle=\dim W-\dim F=n-1
一般情况。我们将 w1,,wdw_1^{\lor},\cdots,w_d^{\lor} 扩充为 WW^{\lor} 的一组基 w1,,wnW,n=dimW=dimWw_1^{\lor},\cdots,w_n^{\lor}\in W^{\lor},n=\dim W=\dim W^{\lor}。显然有:
w1,,wnw1{}^{\bot}\langle w_1^{\lor},\cdots,w_n^{\lor} \rangle\subset\cdots\subset{}^{\bot}\langle w_1^{\lor}\rangle
我们考虑
dim(w1,,wk+1=w1,,wkwk+1)dim(w1,,wk)+dim(wk+1)dim(wk+1+w1,,wk)dim(w1,,wk)+dim(wk+1)dimW=dim(w1,,wk)1\begin{aligned} &\dim({}^{\bot}\langle w_1^{\lor},\cdots,w_{k+1}^{\lor} \rangle={}^{\bot}\langle w_1^{\lor},\cdots,w_{k}^{\lor} \rangle\cap{}^{\bot}\langle w_{k+1}^{\lor} \rangle)\\ \ge& \dim({}^{\bot}\langle w_1^{\lor},\cdots,w_{k}^{\lor} \rangle)+\dim({}^{\bot}\langle w_{k+1}^{\lor} \rangle)-\dim({}^{\bot}\langle w_{k+1}^{\lor} \rangle+{}^{\bot}\langle w_1^{\lor},\cdots,w_{k}^{\lor} \rangle)\\ \ge& \dim({}^{\bot}\langle w_1^{\lor},\cdots,w_{k}^{\lor} \rangle)+\dim({}^{\bot}\langle w_{k+1}^{\lor} \rangle)-\dim W^{\lor}\\ =&\dim({}^{\bot}\langle w_1^{\lor},\cdots,w_{k}^{\lor} \rangle)-1 \end{aligned}
发现每一步至多降 11,共 n1n-1 步,需要恰好降 n1n-1 维,所以每一步恰好降 $$1$,即:
k,dimw1,,wk=nk\forall k,\dim{}^{\bot}\langle w_1^{\lor},\cdots,w_k^{\lor} \rangle=n-k
代入 k=dk=d,即得引理。
证明 8-13:我们只证明与 VV 有关的左半边。考虑先前所证明的 B(v,w)=ψ(v),wWB(v,w)=\langle \psi(v),w \rangle _W ,其中 ψ:VW\psi:V\xrightarrow{\sim} W^{\lor}。为同构是因为 BB 非退化。考虑对 ψ(V0)W\psi(V_0)\subset W^{\lor} 选一组基 w1,,wdw_1^{\lor},\cdots,w_d^{\lor},由引理可得,
dimV0=dimw1,,wd=dimWd=dimVdimV0\dim V_0^{\bot}=\dim{}^{\bot}\langle w_1^{\lor},\cdots,w_d^{\lor}\rangle=\dim W-d=\dim V-\dim V_0
对等式变形即得原命题。
命题 8-14BB 非退化,则 (V0)=V0,(W0)=W0{}^{\bot}(V_0^{\bot})=V_0,({}^{\bot}W_0)^{\bot}=W_0
证明 8-14:显然有 V0(V0)V_0\subset {}^{\bot}(V_0^{\bot}),但又有 dimV0=dim(V0)\dim V_0=\dim {}^{\bot}(V_0^{\bot}),故原等式成立。

九、实内积结构

定义 9-1VVR\mathbb R 向量空间,双线性形式 ():V×VR(\cdot|\cdot):V\times V\rightarrow \mathbb R,若 ()(\cdot|\cdot) 正定且对称,则称 ()(\cdot|\cdot)VV 上的内积,(V,())(V,(\cdot|\cdot)) 称为实内积空间,在本章简称内积空间。
例子 9-1
  • V=Rn,(xy)=xy=i=1nxiyiV=\mathbb{R}^n,(x|y)=x\cdot y=\displaystyle\sum_{i=1}^nx_iy_i。称为 Rn\mathbb{R}^n 上的标准内积。
  • V={f:[0,1]R,连续函数}V=\{f:[0,1]\rightarrow \mathbb{R},\text{连续函数}\},且 (f1f2)=01f1f2dx(f_1|f_2)=\displaystyle\int_0^1 f_1f_2\mathrm{d}x。不难验证对称,双线性,由保序性可得正定性。
VV 有限维,则正定性可推得 ()(\cdot|\cdot) 非退化。
定义 9-2
  • vvv\bot v' 表示 (vv)=0(v|v')=0。若 V1,V2VV_1,V_2\subset V 为子空间,则若 v1V1,v2V2\forall v_1\in V_1,v_2\in V_2 都有 v1v2v_1\bot v_2,则称 V1V2V_1\bot V_2
  • v\lVert v \rVert 表示 (vv)\sqrt{(v|v)}。称 vv 为单位向量,若 v=1\lVert v\rVert=1
  • V0V_0^{\bot} 定义为 {vVv0V0,v0v}\{ v\in V|\forall v_0\in V_0,v_0\bot v \}
根据线性性拆 (v1+v2v1+v2)(v_1+v_2|v_1+v_2),我们可以得到以下等式:
(v1v2)=12(v1+v22v12v22)(v_1|v_2)=\dfrac{1}{2}(\lVert v_1+v_2 \rVert^2-\lVert v_1 \rVert^2-\lVert v_2 \rVert^2)
命题 9-1:由以上推到可以得到内积空间中的勾股定理:
v1v2v1+v22=v12+v22v_1\bot v_2\Rightarrow \lVert v_1+v_2 \rVert^2=\lVert v_1 \rVert^2+\lVert v_2 \rVert^2
命题 9-2:柯西不等式:
(vw)2(vv)(ww)(v|w)^2\le (v|v)(w|w)
证明 9-2
等号成立,当且仅当 v,wv,w 线性相关,即 tR\exist t\in\mathbb{R} 使得 v=twv=tww=tvw=tv。(考虑两种情况是因为有可能 t=0t=0
线性相关时等号显然成立,只需要把 tt 根据线性性拆出来即可。下设 v,wv,w 线性无关,则 v+tw0v+tw\ne0,根据正定性,对所有 tt 有:
0<(v+twv+tw)=(vv)+t2(ww)+2t(vw),t0<(v+tw|v+tw)=(v|v)+t^2(w|w)+2t(v|w),\forall t
Δ=(2(vw))24(vv)(ww)<0\Delta=(2(v|w))^2-4(v|v)(w|w)<0,即:
(vw)2<(vv)(ww)(v|w)^2< (v|v)(w|w)
命题 9-3:三角不等式:
v+wv+w\lVert v+w \rVert\le \lVert v \rVert+\lVert w \rVert
等号成立当且仅当 t0\exist t\ge 0v=twv=tww=tvw=tv
证明 9-3
v+w2=v2+w2+2(vw)v2+w2+2(vw)v2+w2+2vw=(v+w)2\begin{aligned} \lVert v+w \rVert^2&=\lVert v\rVert^2+\lVert w\rVert^2+2(v|w)\\ &\le \lVert v\rVert^2+\lVert w\rVert^2+2|(v|w)|\\ &\le \lVert v\rVert^2+\lVert w\rVert^2+2\lVert v\rVert\lVert w\rVert\\ &=(\lVert v\rVert+\lVert w\rVert)^2 \end{aligned}
其中第二个不等号成立,当且仅当 v,wv,w 线性相关。第一个不等号成立,当且仅当 (vw)0(v|w)\ge 0,即线性相关对应的 t0t\ge 0
定义 9-3:定义 0(v,w)<π0\le \angle(v,w)< \pi 为:
cos(v,w)=(vw)vw,v,w0\cos\angle(v,w)=\dfrac{(v|w)}{\lVert v\rVert\lVert w\rVert},v,w\ne 0
注意到三角不等式表明,我们定义 d(v,w)=vwd(v,w)=\lVert v-w \rVert ,则可以将 (V,d)(V,d) 定义为度量空间,可以在上面定义极限等操作。
定义 9-4(V,()V),(W,()W)(V,(\cdot|\cdot)_V),(W,(\cdot|\cdot)_W) 为内积空间,若 THom(V,W)T\in\mathrm{Hom}(V,W) 满足:
(Tv1Tv2)W=(v1v2)V,v1,v2V(Tv_1|Tv_2)_W=(v_1|v_2)_V,\forall v_1,v_2\in V
等价于说
TvW=vV,vV\lVert Tv \rVert _W=\lVert v \rVert _V,\forall v\in V
则称 TT 是保距的。
从保距可以推出单性。因为有 Tv=0Tv=0v=0v=0Tv=0\Rightarrow \lVert Tv \rVert=0\Rightarrow \lVert v \rVert=0\Rightarrow v=0
定义 9-5:若 TT 保距且为向量空间同构,则称其为内积空间的同构,T1T^{-1} 亦为内积空间同构。
定义 9-6(V,())(V,(\cdot|\cdot)) 为内积空间,SV{0}S\subset V-\{0\} 为子集,若 v,vS\forall v,v'\in Svvvvv\ne v'\Rightarrow v\bot v',则称 SS 是正交子集。进一步,若 vS\forall v\in S 为单位向量,则称 SS 为单位正交子集。由下命题,也可称为单位正交基。
命题 9-4SS 正交可以推得其线性无关。
证明 9-4
sSass=0\displaystyle\sum_{s\in S}a_ss=0,则 sS\forall s'\in S 有:
0=(sSasss)=sSas(ss)=ass20=\left(\sum_{s\in S}a_ss | s' \right)=\sum_{s\in S}a_s(s|s')=a_{s'}\lVert s' \rVert^2
由于 s0s'\ne 0,故 as=0,sSa_{s'}=0,\forall s'\in S。即 SS 线性无关。
若选择 v1,,vnv_1,\cdots,v_n 单位正交基作为 VV 的基,将其变为 Rn\mathbb{R}^n,则有 (Rn,())(\mathbb{R}^n,(\cdot|\cdot))(V,()V)(V,(\cdot|\cdot)_V) 之间的同构,其中 ()(\cdot|\cdot) 为标准内积:
RnV(x1,,xn)i=1nxivi\begin{aligned} \mathbb{R}^n&\xrightarrow{\sim} V\\ (x_1,\cdots,x_n)&\mapsto\sum_{i=1}^n x_iv_i \end{aligned}
且其保距:
(iaivijbjvj)=i,jaibj(vivj)=iaibi=((ai)i(bj)j)\left(\sum_i a_iv_i|\sum_j b_jv_j \right)=\sum_{i,j}a_ib_j(v_i|v_j)=\sum_{i}a_ib_i=((a_i)_i|(b_j)_j)
定义 9-6:对 AMn×n(R)A\in\mathrm{M}_{n\times n}(\mathbb R),且 tA=A{}^{\rm t}A=A,如果 tvAv0{}^{\rm t} vAv\ge 0 且等号成立当且仅当 v=0v=0,则称 AA 为正定矩阵。
Rn=Mn×1(R)\mathbb{R}^n=\mathrm{M}^{n\times 1}(\mathbb R) 上的内积为 (vw)=tvAw(v|w)={}^{\rm t}vAw,则 (vw)=vAw=(t)Avw(v|w)=v\cdot Aw={}^{(\rm t)}Av\cdot w,其中 \cdotRn\mathbb{R}^n 上标准内积。
定义 9-7(V,()V)(V,(\cdot|\cdot)_V) 为内积空间,则取 V0VV_0\subset V 为子空间依然对应一个内积空间 (V0,()V0)(V_0,(\cdot|\cdot)_{V_0}),定义 V0V_0 的正交补 V0V_0^{\bot} 为:
{vVv0V0,vv0}V\{v\in V|\forall v_0\in V_0,v\bot v_0\}\subset V
定义 9-8:对内积空间 (V,())(V,(\cdot|\cdot)) 和一族子空间 (Vi)iI(V_i)_{i\in I},如果:
  • 有直和分解 V=iIViV=\displaystyle\bigoplus_{i\in I} V_i 成立。
  • iji\ne j 时有 ViVjV_i\bot V_j
则称 V=iIViV=\displaystyle\bigoplus_{i\in I} V_iVV 的正交直和分解。
命题 9-5:对内积空间 (V,())(V,(\cdot|\cdot)) 和有限维子空间 V0V_0 有正交直和分解:
V=V0V0V=V_0\oplus V_0^{\bot}
考虑 v1,vmv_1\cdots,v_mV0V_0 的单位正交基,vV\forall v\in V 有:
v=i=1m(viv)viV0+(vi=1m(viv)vi)V0\begin{aligned} v=\sum_{i=1}^m(v_i|v)v_i \in V_0\\ +\left(v-\sum_{i=1}^m(v_i|v)v_i\right) \in V_0^{\bot} \end{aligned}

十三、标准形

什么是标准形

考虑矩阵之间的等价关系共轭,称 A,BMn×n(F)\mathbf A,\mathbf B\in\mathrm M_{n\times n}(F) 共轭,当且仅当存在可逆矩阵 P\mathbf P 使得:
A=P1BP\mathbf A=\mathbf P^{-1}\mathbf B\mathbf P
也可以理解为在换基后两个矩阵相等,或对应的 F[X]F[X] 模同构。
判断矩阵共轭是一个非常重要的问题。一个自然的想法是找到每个共轭等价类的代表元,作为所谓的“标准”,这样只需判断矩阵共轭到的“标准”是否相同即可。这个“标准”的矩阵就称为标准形。
比如对于可对角化矩阵(回忆到可对角化当且仅当极小多项式分裂无重根),对应到的对角矩阵即为一种标准形。但由于并非所有矩阵都可对角化,我们需要找到一些更普适的方法。

从模论的结构定理出发

回忆到模论中的结构定理,将模按照挠元直和分解:
RR 为主理想环,MM 为有限生成 RR 模,则有同构:
MR/I1R/IkEM \simeq R/I_1\oplus\cdots R/I_k\oplus E
其中
  • kZ0k\in\mathbb Z_{\ge 0}IkI1I_k\subset\cdots\subset I_1RR 中的一列非零真理想。
  • EE 是有限生成自由 RR 模。
且分解具有唯一性。
由于 F[X]F[X] 为主理想环,所以我们可以将上述结论直接套到 F[X]F[X] 模上,尝试找到对应的矩阵版本。根据上述形式,我们来考察 M/IM/I 对应的矩阵 A\bf A。其中不妨设 I=(f),fF[X]\FI=(f),f\in F[X]\backslash F,定义 nndegf=dimM/I\deg f=\dim M/I。考虑 M/IM/I 作为 FF 向量空间的有序基,可以取为:
1+(f),X+(f),,Xn1+(f)1+(f),X+(f),\cdots,X^{n-1}+(f)
那么该模对应的线性映射 TT 的效果显然是 T(g+(f))=Xg+(f)T(g+(f))=Xg+(f),那想要知道对应的 A\bf A 是什么效果只需要考察它在上述有序基的表现即可。唯一特殊的是:
T(Xn1+(f))=Xn+(f)=c0c1Xcn1Xn1+(f)T(X^{n-1}+(f))=X^n+(f)=-c_0-c_1X-\cdots-c_{n-1}X^{n-1}+(f)
那么自然有:
f=c0++cn1Xn1+XnF[X]f=c_0+\cdots+c_{n-1}X^{n-1}+X^n\in F[X],其中 nZ1n\in\mathbb{Z}_{\ge 1}。对于 F[X]F[X]F[X]/(f)F[X]/(f) 取其有序基为上述有序基,则其对应的 n×nn\times n 矩阵是 ff 的友矩阵:
Cf=(000c0100c1010c2001cn1)\mathbf{C}_f= \begin{pmatrix} 0&0&\cdots&0&-c_0\\ 1&0&\cdots&0&-c_1\\ 0&1&\cdots&0&-c_2\\ \vdots&&\ddots&&\vdots\\ 0&0&\cdots&1&-c_{n-1} \end{pmatrix}
那么套入结构定理即:
nZ1n\in\mathbb{Z}_{\ge 1},而 AMn×n(F)\mathbf{A}\in\mathrm{M}_{n\times n}(F),存在唯一一列前后整除的非常数首一多项式:
f1fk,fiF[X]f_1|\cdots|f_k,f_i\in F[X]
使得 i=1kdegfi=n\sum_{i=1}^k \deg f_i=nA\bf A 共轭于分块对角矩阵:
diag(Cf1,,Cfk)\mathrm{diag}(\mathbf{C}_{f_1},\cdots,\mathbf{C}_{f_k})
该矩阵称为 A\bf A 的有理标准形,f1,,fkf_1,\cdots,f_k 称为 A\bf A 的不变因子。
这里没有自由模是因为 A\bf A 是有限维的,但是 F[X]F[X] 是无限维的。
且不难验证:
  • A\bf A 的极小多项式 MinA=fk\mathrm{Min}_{\bf A}=f_k
  • A\bf A 的特征多项式 CharA=i=1kfi\mathrm{Char}_{\bf A}=\prod_{i=1}^k f_i
可以发现,这里给出了 Cayley-Hamilton 定理的证明,因为该论证自然说明了 MinACharA\mathrm{Min}_{\bf A}|\mathrm{Char}_{\bf A},且只依赖于模论的结构定理。
根据结构定理的另一种基于素元分解的写法,我们还可以把上述形式改写为:
AMn×n(F)\mathbf A\in\mathrm M_{n\times n}(F),取 MinA\mathrm{Min}_{\bf A} 的不可约分解 p1e1phehp_1^{e_1}\cdots p_h^{e_h},其中 p1,,php_1,\cdots,p_h 是相异的不可约首一多项式,则 A\bf A 共轭于形如 diag(A1,,Ah)\mathrm{diag}(\mathbf A_1,\cdots,\mathbf A_h) 的分块对角矩阵,其中对每个 1jh1\le j\le h 都有:
Aj=diag(Cpjb1,j,,Cpjbrj,j),rjZ1,1b1,jbrj,j\mathbf A_j=\mathrm{diag}\left(\mathbf C_{p_j}^{b_{1,j}},\cdots,\mathbf C_{p_j}^{b_{r_j,j}}\right),r_j\in\mathbb Z_{\ge 1},1\le b_{1,j}\le \cdots\le b_{r_j,j}
不难发现 CharAj=pjb1,j+\mathrm{Char}_{\mathbf A_j}=p_j^{b_{1,j}+\cdots} 正是 CharA\mathrm{Char}_{\bf A} 中被 pjp_j 整除的部分。
之所以称为有理,是与 Jordan 标准形作为对比。Jordan 标准形要求矩阵特征多项式分裂,而有理标准形无需。所以后者不需要将 Q\mathbb Q 扩域为 C\mathbb C 也能操作。
如何计算有理标准形呢?考虑引理:
EE 为秩 nn 自由 F[X]F[X] 模,NN 为子模。任选 EE 的基 e1,,ene_1,\cdots,e_nNN 的生成元 x1,,xmx_1,\cdots,x_m,取 AMn×m(F[X])\mathbf A\in\mathrm{M}_{n\times m}(F[X]),其中
(x1xm)=(e1e1)A\begin{pmatrix}x_1&\cdots&x_m\end{pmatrix}=\begin{pmatrix}e_1&\cdots&e_1\end{pmatrix}\bf A
这里 xj,eix_j,e_i 虽然不是列向量,但可以理解为:
xj=i=1naijeix_j=\sum_{i=1}^n a_{ij}e_i
存在可逆矩阵 PMm×m,QMn×n\mathbf P\in\mathrm{M}_{m\times m},\mathbf Q\in\mathrm{M}_{n\times n} 使得:
A=Q(d1d2)P\mathbf{A}=\mathbf{Q}\begin{pmatrix}d_1&&\\\\&d_2&\\\\&&\ddots\end{pmatrix}\bf P
d1d2d_1|d_2|\cdots,则:
E/Ni=1nF[X]/(di)E/N\simeq\bigoplus_{i=1}^n F[X]/(d_i)
事实上,取 (f1fn)=(e1e1)Q\begin{pmatrix}f_1&\cdots&f_n\end{pmatrix}=\begin{pmatrix}e_1&\cdots&e_1\end{pmatrix}\bf Q,那么 N=i=1nRdifiN=\oplus_{i=1}^n Rd_if_i。只需将 P\bf P 除到右边即可,且注意到这并不改变右边依然生成 NN。之后代入直和取商即得同构。
那我们考虑取 E=F[X]nE=F[X]^{\oplus n},考察同态:
φ:F[X]nVi=1nrieii=1nri(T)vi\begin{aligned} \varphi:&F[X]^{\oplus n}\rightarrow V\\ &\sum_{i=1}^n r_ie_i\mapsto\sum_{i=1}^n r_i(T)v_i \end{aligned}
其中 V,TV,TF[X]F[X] 对应的二元组,显然 φ\varphi 满。考虑其核,可以证明其核为:
x1,,xn\langle x_1,\cdots,x_n\rangle
其中:
xj=Xeji=1naijeix_j=Xe_j-\sum_{i=1}^n a_{ij}e_i
所以我们有同构:
VF[X]n/ker(φ)i=1nF[X]/(di)V\simeq F[X]^{\oplus n}/\mathrm{ker}(\varphi)\simeq \bigoplus_{i=1}^n F[X]/(d_i)
考虑最后一项由上述引理确定,只需考虑对应的转化矩阵。事实上取 X1n×nAX\cdot \mathbf 1_{n\times n}-\bf A 即可,其中 A\bf ATT 对应的矩阵。不难验证:
(x1xn)=(e1e1)(X1n×nA)\begin{pmatrix}x_1&\cdots&x_n\end{pmatrix}=\begin{pmatrix}e_1&\cdots&e_1\end{pmatrix}(X\cdot \mathbf 1_{n\times n}-\bf A)
那么我们将 X1n×nAX\cdot \mathbf 1_{n\times n}-\bf A 消元得到对角矩阵后得到的 did_i 即为上述同构中对应的 did_i,从而就是 TT 有理标准形中的不变因子!
对于任意交换环 RR 定义相抵:设 L,MMm×n(R)\mathbf{L,M}\in \mathrm{M}_{m\times n}(R),若存在可逆矩阵 PMn×n(R),QMm×m(R)\mathbf{P}\in \mathrm{M}_{n\times n}(R),\mathbf{Q}\in \mathrm{M}_{m\times m}(R) 使得 L=QMP\mathbf{L=QMP},则称 L,M\bf L,M 相抵。那么对所有 A,BMn×n(F)\mathbf{ A,B}\in\mathrm M_{n\times n}(F) 下列称述等价:
  • A,B\bf A,BMn×n(F)\mathrm M_{n\times n}(F) 中共轭。
  • X1n×nAX\cdot\mathbf 1_{n\times n}-\bf AX1n×nBX\cdot\mathbf 1_{n\times n}-\bf BMn×n(F[X])\mathrm M_{n\times n}(F[X]) 中相抵。
相抵只需进行初等行列变换消元即可!所以我们成功把矩阵共轭问题转化为了消元问题。

特殊矩阵的有理标准形

考虑幂零矩阵:
RR 为环,rRr\in R,若存在 d1d\ge 1 使得 rd=0Rr^d=0_R,则称 rr 幂零,条件中最小可能的 dd 称为 rr 的幂零指数。
dimV=nZ1\dim V=n\in\mathbb Z_{\ge 1},而 TEnd(V)T\in\mathrm{End}(V),则以下陈述相互等价:
  • TT 幂零。
  • 存在 kZ1k\in\mathbb Z_{\ge 1},使得 MinT=Xk\mathrm{Min}_T=X^k
  • CharT=Xn\mathrm{Char}_T=X^n
  • V=V[0]V=V_{[0]}
其中 kkTT 的幂零指数。
那我们考虑幂零矩阵的有理标准形,对应的不变因子一定是 XkX^k,友矩阵为:
CXk=(0001000010)\mathbf{C}_{X^k}=\begin{pmatrix} 0&0&\cdots&0\\ 1&0&\ddots&\vdots\\ 0&\ddots&\ddots&0\\ 0&\cdots&1&0 \end{pmatrix}
进一步地,我们考虑特征多项式分裂的矩阵,那么不变因子的形式一定形如 (Xλ)k(X-\lambda)^k,那么考虑将上述矩阵平移 λ\lambda 即得:
Cλ=(λ001λ0001λ)\mathbf{C}_{\lambda}=\begin{pmatrix} \lambda&0&\cdots&0\\ 1&\lambda&\ddots&\vdots\\ 0&\ddots&\ddots&0\\ 0&\cdots&1&\lambda \end{pmatrix}
因为有:
MinCXk=CharCXk=Xk\mathrm{Min}_{\mathbf{C}_{X^k}}=\mathrm{Char}_{\mathbf{C}_{X^k}}=X^k
通过简单的平移可知:
MinCλ=CharCλ=(Xλ)k\mathrm{Min}_{\mathbf{C}_{\lambda}}=\mathrm{Char}_{\mathbf{C}_{\lambda}}=(X-\lambda)^k
由于极小多项式和特征多项式相同,所以它共轭于 (Xλ)k(X-\lambda)^k 的友矩阵。这样,我们对于特征多项式分裂的矩阵就找到了一个新的利用上述矩阵的分块方法,称为 Jordan 标准形。

Jordan 标准形

定义 Jordan 块如下:
λF,dZ1\lambda\in F,d\in\mathbb Z_{\ge 1}。则特征值为 λ\lambdad×dd\times d 的上三角 Jordan 块定义为以下矩阵:
Jd(λ)=(λ10000λ1000000λ10000λ)Md×d(F)\mathbf J_d(\lambda)= \begin{pmatrix} \lambda&1&0&\cdots&0&0\\ 0&\lambda&1&\cdots&0&0\\ \vdots&&\ddots&\ddots&&0\\ \vdots&&&\ddots&\ddots&\vdots\\ 0&0&\cdots&0&\lambda&1\\ 0&0&\cdots&0&0&\lambda \end{pmatrix} \in \mathrm M_{d\times d}(F)
特征值为 λ\lambdad×dd\times d 下三角 Jordan 块为:
Jd(λ)=tJd(λ)\mathbf J_d^{\text{下}}(\lambda)={}^{\rm t}\mathbf{J}_d(\lambda)
其中 J1(λ)=J1(λ)=λF=M1×1(F)\mathbf J_1(\lambda)=\mathbf J_1^{\text{下}}(\lambda)=\lambda\in F=\mathrm M_{1\times 1}(F)
那么基于有理标准形一模一样的结论,我们有 Jordan 标准形。
VVnn 为向量空间,TEnd(V)T\in\mathrm{End}(V)。设 CharT\mathrm{Char}_TFF 上分裂,记其相异根为 λ1,,λmF\lambda_1,\cdots,\lambda_m\in F。存在 VV 的有序基,使得 TT 表为分块对角矩阵 diag(A1,,Am)\mathrm{diag}(\mathbf A_1,\cdots,\mathbf A_m),其中:
Aj=(Jb1,j(λj)Jbrj,j(λj))\mathbf A_j= \begin{pmatrix} \boxed{\mathbf J_{b_{1,j}}(\lambda_j)}&&\\ &\ddots&\\ &&\boxed{\mathbf J_{b_{r_j,j}}(\lambda_j)} \end{pmatrix}
bi,jb_{i,j}TT 唯一确定。上述矩阵称为 TT 的约旦标准形。以 Ji,j(λj)\mathbf J_{i,j}^{\text{下}}(\lambda_j) 代替 Ji,j(λj)\mathbf J_{i,j}(\lambda_j),论断依然成立。
该形式无非是
AMn×n(F)\mathbf A\in\mathrm M_{n\times n}(F),取 MinA\mathrm{Min}_{\bf A} 的不可约分解 p1e1phehp_1^{e_1}\cdots p_h^{e_h},其中 p1,,php_1,\cdots,p_h 是相异的不可约首一多项式,则 A\bf A 共轭于形如 diag(A1,,Ah)\mathrm{diag}(\mathbf A_1,\cdots,\mathbf A_h) 的分块对角矩阵,其中对每个 1jh1\le j\le h 都有:
Aj=diag(Cpjb1,j,,Cpjbrj,j),rjZ1,1b1,jbrj,j\mathbf A_j=\mathrm{diag}\left(\mathbf C_{p_j}^{b_{1,j}},\cdots,\mathbf C_{p_j}^{b_{r_j,j}}\right),r_j\in\mathbb Z_{\ge 1},1\le b_{1,j}\le \cdots\le b_{r_j,j}
有理标准形把 C\mathbf C 共轭为 J\mathbf J 的结果。
对于 Jordan 标准形的计算,因为它无外乎是有理标准形套皮,所以计算有理标准形的方法自然也可以应用于 Jordan 标准形,求出不变因子即可。但我们也可以通过计算秩来确定。以下只给出幂零矩阵的情况,非幂零矩阵只需对每个特征值考虑,平移为幂零矩阵的情况即可。(即将 TT 改为 TλT-\lambda
VVnnFF 向量空间,TEnd(V)T\in\mathrm{End}(V) 幂零,则:
  1. TT 的 Jordan 标准形中,Jordan 块的总数为 nrkTn-\mathrm{rk}T
  2. 对于每个 d1d\ge 1,标准形中的 d×dd\times d Jordan 块的个数 N(d)N(d) 满足: N(d)=rk(Td+1)+rk(Td1)2rk(Td)N(d)=\mathrm{rk}(T^{d+1})+\mathrm{rk}(T^{d-1})-2\mathrm{rk}(T^d)
对于 (1),注意到 Jd(0)\mathbf J_d(0) 的秩为 d1d-1,故 rkT\mathrm{rk}T 就等于 nn 减去 Jordan 块总数。
对于 (2),计算 Jb(0)k\mathbf{J}_b(0)^k,不难发现:
rk(Jb(0)k)={0k>bbkkb\mathrm{rk}(\mathbf{J}_b(0)^k)=\begin{cases} 0&k>b\\ b-k&k\le b \end{cases}
d1d\ge 1 时:
rk(Td+1)rk(Td)=bjd+1(bjd1)bjd(bjd)=bjd+1(1)\mathrm{rk}(T^{d+1})-\mathrm{rk}(T^d)=\sum_{b_j\ge d+1}(b_j-d-1)-\sum_{b_j\ge d}(b_j-d)=\sum_{b_j\ge d+1}(-1)
自然有:
rk(Td)rk(Td1)=bjd(1)\mathrm{rk}(T^{d})-\mathrm{rk}(T^{d-1})=\sum_{b_j\ge d}(-1)
相减即可。

评论

5 条评论,欢迎与作者交流。

正在加载评论...