专栏文章

线性代数

个人记录参与者 1已保存评论 0

文章操作

快速查看文章及其快照的属性,并进行相关操作。

当前评论
0 条
当前快照
1 份
快照标识符
@mipvut09
此快照首次捕获于
2025/12/03 18:47
3 个月前
此快照最后确认于
2025/12/03 18:47
3 个月前
查看原文

线性代数

1 行列式

1.1 nn 阶行列式

定义 1.1.1:称以下的式子为一个 nn 阶行列式
A=a11a12a1na21a22a2nan1an2ann\begin{vmatrix}\mathbf A\end{vmatrix}= \begin{vmatrix} a_{11}& a_{12}&\cdots&a_{1n} \\ a_{21}&a_{22}&\cdots&a_{2n} \\ \vdots&\vdots&\ddots&\vdots \\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}
其中第 ii 行第 jj 列的元素成为行列式 A\begin{vmatrix}\mathbf A\end{vmatrix} 的第 (i,j)(i,j) 元素。 元素 a11,a22,,anna_{11},a_{22},\cdots,a_{nn} 称为 A\begin{vmatrix}\mathbf A\end{vmatrix} 的主对角线。
性质 1:上三角行列式的值等于其对角线元素之和。 性质 2:行列式某行(列)全为零,则行列式的值等于零。 性质 3:用常数 cc 乘以行列式的某一行(列),得到的行列式的值等于原行列式的值的 cc 倍。 性质 4:交换行列式不同的两行(列),行列式的值变号。 性质 5:若行列式两行(列)成比例,则行列式的值为零。 性质 6:若行列式中某行(列)元素均为两项之和,则行列式可表示为两个行列式之和。 性质 7:行列式的某一行(列)乘以某个数加到另一行(列)上,行列式的值不变。 性质 8:行列式和其转置有相同的值。
定义 1.1.2:定义元素 aija_{ij}余子式 MijM_{ij} 为由其行列式 A\begin{vmatrix}\mathbf A\end{vmatrix} 中划去第 ii 行第 jj 列后剩下的元素组成的行列式。 定义 1.1.3:在行列式 A\begin{vmatrix}\mathbf A\end{vmatrix} 中,aija_{ij}代数余子式定义为:Aij=(1)i+jMijA_{ij} = (-1)^{i+j}M_{ij},其中 MijM_{ij}aija_{ij} 的余子式。

1.2 行列式的展开

A\begin{vmatrix}\mathbf A\end{vmatrix}nn 阶行列式,元素 aija_{ij} 的代数余子式记为 AijA_{ij},则对任意 s,r(=1,2,,n),srs,r(=1,2,\cdots,n),s\neq r 存在:
A=i=1nairAiri=1nairAis=0\begin{vmatrix}\mathbf A\end{vmatrix}=\sum\limits_{i=1}^n a_{ir}A_{ir} \\ \sum\limits_{i=1}^n a_{ir}A_{is}=0

1.3 Cramer 法则

设线性方程组:
{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2                          an1x1+an2x2++annxn=bn\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1 \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2 \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots \\ a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n=b_n \end{cases}
记其系数行列式A\begin{vmatrix}\mathbf A\end{vmatrix} ,则:
x1=A1A,x2=A2A,,xn=AnAx_1=\dfrac{\begin{vmatrix}\mathbf A_1\end{vmatrix}}{\begin{vmatrix}\mathbf A\end{vmatrix}},x_2=\dfrac{\begin{vmatrix}\mathbf A_2\end{vmatrix}}{\begin{vmatrix}\mathbf A\end{vmatrix}},\cdots,x_n=\dfrac{\begin{vmatrix}\mathbf A_n\end{vmatrix}}{\begin{vmatrix}\mathbf A\end{vmatrix}}
其中 Aj\begin{vmatrix}\mathbf A_j\end{vmatrix}A\begin{vmatrix}\mathbf A\end{vmatrix} 去掉第 jj 列并用 b1,b2,,bnb_1,b_2,\cdots,b_n 将之替换的 nn 阶行列式。

2 矩阵

2.1 矩阵的概念

定义 2.1.1:由 mnmn 个数 aij(i=1,2,,m;j=1,2,n)a_{ij}(i=1,2,\cdots,m;j=1,2,\cdots n) 排成 mmnn 列的矩形阵列:
a11a12a1na21a22a2nan1an2ann\begin{matrix} a_{11}&a_{12}&\cdots&a_{1n} \\ a_{21}&a_{22}&\cdots&a_{2n} \\ \vdots&\vdots&\ddots&\vdots \\ a_{n1}&a_{n2}&\cdots&a_{nn} \\ \end{matrix}
称为 mmnn 列矩阵,简称为 m×nm\times n 矩阵(或 m×nm\times n 阵)。
A\mathbf A 的元素全是实数则称 A\mathbf A实矩阵。 若 A\mathbf A 的元素全是复数则称 A\mathbf A复矩阵。 若所有元素均为 00 则称为零矩阵 O\mathrm O,或 Om×n\mathrm O_{m\times n}。 若 m=nm=n 则称为方阵,反之为长方阵。 若方阵 A\mathbf A 仅存在对角元 a11,a22,,anna_{11},a_{22},\cdots,a_{nn} 则简记为 A=diag(a11,a22,,ann)\mathbf A=\mathbf{diag}(a_{11},a_{22},\cdots,a_{nn})。 进一步,若 a11=a22==ann=1a_{11}=a_{22}=\cdots=a_{nn}=1 则称 In=diag(1,1,,1)\mathbf {I_n}=\mathbf{diag}(1,1,\cdots,1)nn 阶单位矩阵

2.2 矩阵的运算

一、矩阵加减法
定义 2.2.1:设有两个 m×nm\times n 矩阵 A=(aij),B=(bij)\mathbf A=(a_{ij}),\mathbf B=(b_{ij}),定义 A+B\mathbf A+\mathbf B 是一个 m×nm\times n 矩阵且 A+B\mathbf A+\mathbf B 的第 (i,j)(i,j) 元素等于 aij+bija_{ij}+b_{ij},即A+B=(aij+bij)\mathbf A+\mathbf B=(a_{ij}+b_{ij}) 矩阵的减法可看作矩阵加法的逆运算,即 AB=(aijbij)\mathbf A-\mathbf B=(a_{ij}-b_{ij}) 定义 2.2.2:定义 A=(aij)\mathbf A=(a_{ij}) 的负矩阵为 A=(aij)-\mathbf A=(-a_{ij}),则有 A+(A)=O\mathbf A+(-\mathbf A)=\mathbf O
矩阵加减法运算规则
  1. 交换律:A+B=B+A\mathbf A+\mathbf B=\mathbf B+\mathbf A
  2. 结合律:(A+B)+C=A+(B+C)(\mathbf A+\mathbf B)+\mathbf C=\mathbf A+(\mathbf B+\mathbf C)
  3. O+A=A+O=A\mathbf O+\mathbf A=\mathbf A+\mathbf O=\mathbf A
  4. A+(B)=AB\mathbf A+(-\mathbf B)=\mathbf A-\mathbf B
二、矩阵的数乘
定义 2.2.3:设 A\mathbf A 是一个 m×nm\times n 矩阵,A=(aij)m×n\mathbf A=(a_{ij})_{m\times n}cc 是一个常数,定义 cA=(caij)m×nc\mathbf A=(ca_{ij})_{m\times n}cAc\mathbf A 称为数 cAc\mathbf A 的数乘。
矩阵的数乘运算规则
  1. c(A+B)=cA+cBc(\mathbf A+\mathbf B)=c\mathbf A+c\mathbf B
  2. (c+d)A=cA+dA(c+d)\mathbf A=c\mathbf A+d\mathbf A
  3. (cd)A=c(dA)(cd)\mathbf A=c(d\mathbf A)
  4. 1A=A1\cdot\mathbf A=\mathbf A
  5. 0A=O0\cdot\mathbf A=\mathbf O
三、矩阵的乘法
定义 2.2.4:设有 m×km\times k 矩阵 A=(aij)m×k\mathbf A=(a_{ij})_{m\times k},以及 k×nk\times n 矩阵 B=(bij)m×n\mathbf B=(b_{ij})_{m\times n}。定义 A\mathbf AB\mathbf B 的乘积 AB\mathbf A\mathbf B 是一个 m×nm\times n 矩阵且 AB\mathbf A\mathbf B 的第 (i,j)(i,j) 元素
cij=l=1kailbljc_{ij}=\sum\limits_{l=1}^ka_{il}b_{lj}
矩阵乘法的运算规则
  1. 结合律:(AB)C=A(BC)(\mathbf A\mathbf B)\mathbf C=\mathbf A(\mathbf B\mathbf C)
  2. 左右分配律:A(B+C)=AB+AC,(A+B)C=AC+BC\mathbf A(\mathbf B+\mathbf C)=\mathbf A\mathbf B+\mathbf A\mathbf C,(\mathbf A+\mathbf B)\mathbf C=\mathbf A\mathbf C+\mathbf B\mathbf C
  3. c(AB)=(cA)B=A(cB)c(\mathbf A\mathbf B)=(c\mathbf A)\mathbf B=\mathbf A(c\mathbf B)
  4. 对任意的 m×nm\times n 矩阵 A\mathbf AImA=A=AIn\mathbf {I_m}\mathbf A=\mathbf A=\mathbf A\mathbf {I_n}
方阵幂运算规则
  1. ArAs=Ar+s\mathbf A^r\mathbf A^s=\mathbf A^{r+s}
  2. (Ar)s=Ars(\mathbf A^r)^s=\mathbf A^{rs}
四、矩阵的转置
定义 2.2.5:设 A=(aij)\mathbf A=(a_{ij})m×nm\times n 矩阵,定义 A\mathbf A 的转置 AT\mathbf A^{\mathbf T} 为一个 n×mn\times m 矩阵,它的第 kk 行正好是矩阵 A\mathbf A 的第 kk 列(k=1,2,,nk=1,2,\cdots,n);它的第 rr 行是 A\mathbf A 的第 rr 行(r=1,2,,nr=1,2,\cdots,n)。
矩阵转置运算规则
  1. (AT)T=A(\mathbf A^{\mathbf T})^{\mathbf T}=\mathbf A
  2. (A+B)T=AT+BT(\mathbf A+\mathbf B)^{\mathbf T}=\mathbf A^{\mathbf T}+\mathbf B^{\mathbf T}
  3. (cA)T=cAT(c\mathbf A)^{\mathbf T}=c\mathbf A^{\mathbf T}
  4. (AB)T=BTAT(\mathbf A\mathbf B)^{\mathbf T}=\mathbf B^{\mathbf T}\mathbf A^{\mathbf T}
五、矩阵的共轭
定义 2.2.6:设 A=(aij)m×n\mathbf A=(a_{ij})_{m\times n} 是一个复矩阵,则 A\mathbf A共轭矩阵 A\overline{\mathbf A} 是一个 m×nm\times n 复矩阵,且
A=(aij)m×n\overline{\mathbf A}=(\overline a_{ij})_{m\times n}
矩阵共轭运算规则
  1. A+B=A+B\overline{\mathbf A+\mathbf B}=\overline {\mathbf A}+\overline {\mathbf B}
  2. cA=cA\overline{c\mathbf A}=\overline c \overline {\mathbf A}
  3. AB=A B\overline{\mathbf A \mathbf B}=\overline{\mathbf A}\ \overline {\mathbf B}
  4. (AT)=(A)T\overline{({\mathbf A}^{\mathbf T})}=(\overline{\mathbf A})^{\mathbf T}
六、矩阵的迹
定义 2.2.7:设 A\mathbf A 是一个 nn 阶方阵,则 A\mathbf A
tr(A)=i=1naii\mathrm{tr}(\mathbf A)=\sum\limits_{i=1}^na_{ii}

2.3 方阵的逆阵

定义 2.3.1:设 A\mathbf Ann 阶方阵,若存在一个 nn 阶方阵 B\mathbf B,使得:
AB=BA=In,\mathbf A\mathbf B=\mathbf B\mathbf A=\mathbf {I_n},
则称 B\mathbf BA\mathbf A逆阵,记为 B=A1\mathbf B=\mathbf A^{-1}。凡有逆阵的矩阵称为可逆阵非奇异阵(简称非异阵),否则称为奇异阵
矩阵求逆运算规则
  1. A\mathbf A 是非异阵,则 (A1)1=A(\mathbf A^{-1})^{-1}=\mathbf A
  2. A,B\mathbf A,\mathbf B 都是 nn 阶非异阵,则 AB\mathbf A\mathbf B 也是 nn 阶非异阵且 (AB)1=B1A1(\mathbf A\mathbf B)^{-1}=\mathbf B^{-1}\mathbf A^{-1}
  3. A\mathbf A 是非异阵,cc 是非零数,则 cAc\mathbf A 也是非异阵且 (cA)1=c1A1(c\mathbf A)^{-1}=c^{-1}\mathbf A^{-1}
  4. A\mathbf A 是非异阵,则 A\mathbf A 的转置 AT\mathbf A^{\mathbf T} 也是非异阵且 (AT)1=(A1)T(\mathbf A^{\mathbf T})^{-1}=(\mathbf A^{-1})^{\mathbf T}
A\mathbf Ann 阶方阵,这个方阵决定了一个 nn 阶行列式,记为 A\begin{vmatrix}\mathbf A\end{vmatrix}detA\det\mathbf A
定义 2.3.2 :设 AAnn 阶方阵,AijA_{ij} 是行列式 A\begin{vmatrix}\mathbf A\end{vmatrix} 中第 (i,j)(i,j) 元素 aija_{ij} 的代数余子式,则称下列方阵为 A\mathbf A伴随阵
(A11A21An1A12A22An2A1nA2nAnn)\begin{pmatrix} A_{11}&A_{21}&\cdots &A_{n1} \\ A_{12}&A_{22}&\cdots &A_{n2} \\ \vdots&\vdots&\ddots &\vdots \\ A_{1n}&A_{2n}&\cdots &A_{nn} \end{pmatrix}
A\mathbf A 的伴随阵通常记为 A\mathbf {A^*}
引理 2.3.1:设 A\mathbf Ann 阶方阵,A\mathbf A^*A\mathbf A 的伴随阵,则
AA=AA=AIn\mathbf A\mathbf A^*=\mathbf A^*\mathbf A=\begin{vmatrix}\mathbf A\end{vmatrix}\cdot\mathbf{I_{n}}
定理 2.3.1:若 A0\begin{vmatrix}\mathbf A\end{vmatrix}\neq0,则 A\mathbf A 是一个非异阵,且
A1=1AA\mathbf A^{-1}=\dfrac{1}{\begin{vmatrix}\mathbf A\end{vmatrix}} \mathbf A^*

2.4 矩阵的初等变换与初等矩阵

定义 2.4.1:下列三种矩阵变换分别称为矩阵的第一类、第二类、第三类初等行(列)变换:
  1. 对调矩阵中某两行(列)的位置;
  2. 用一非零常数 cc 乘以矩阵的某一行(列);
  3. 将矩阵的某一行(列)乘以常数 cc 后加到另一行(列)上去。
上述 33 种变换统称为矩阵的初等变换

2.5 初等变换法求逆阵

众所周知,用伴随阵求非异阵的逆阵是相当麻烦的,有没有什么更加强势的做法推荐一下: 有的兄弟有的:
A1A=InA1=A1In\mathbf A^{-1}\mathbf A=\mathbf {I_n} \\ \mathbf A^{-1}=\mathbf A^{-1}\mathbf {I_n}
上述和式子启发我们可以这样求逆阵:
考虑一个 n×2nn\times 2n 的矩阵 (AIn)(\mathbf A\mathbf {I_n}),这个矩阵的前 nn 列为 A\mathbf A,后 nn 列为 In\mathbf {I_n}。对矩阵 (AIn)(\mathbf A\mathbf {I_n}) 进行初等变换把 A\mathbf A 变成 In\mathbf {I_n},这时右边的 In\mathbf {I_n} 就变成了 A1\mathbf A^{-1}

2.6 矩阵的秩

定义 2.6.1:在 m×nm\times n 矩阵 A\mathbf A 中,任取 kkkk 列(km,knk\leqslant m,k\leqslant n),位于这些行列交叉处的 k2k^2 个元素,不改变他们在 A\mathbf A 中所处的位置次序二得的 kk 阶行列式,称为矩阵 A\mathbf Akk 阶子式
定义 2.6.2:设在矩阵 A\mathbf A 中有一个不等于 00rr 阶子式 D\mathbf D,且所有 r+1r+1 阶子式(如果存在的话)全等于 00,则 D\mathbf D 称为矩阵 A\mathbf A最高阶非零子式,数 rr 称为矩阵 A\mathbf A 的秩,记作 R(A)\text R(\mathbf A)。并规定零矩阵的秩为 00

3 向量组的线性相关性

3.1 向量组及其线性组合

定义 3.1.1nn 个有次序的数 a1,a2,,ana_1,a_2,\cdots,a_n 所组成的数组称为 nn 维向量,这 nn 个数称为该向量的 nn 个分量,第 ii 个数 aia_i 称为第 ii 个分量。
定义3.1.2:给定向量组 A:a1,a2,,amA:\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_m,对于任何一组实数 k1,k2,,kmk_1,k_2,\cdots,k_m,表达式 i=1mkiai\sum\limits_{i=1}^{m}k_i\mathbf a_i称为向量组 AA 的一个线性组合,k1,k2,,knk_1,k_2,\cdots,k_n 称为这个线性组合的系数。

3.2 向量组的线性相关性

定义 3.2.1:给定向量组 A:a1,a2,,amA:\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_m,如果存在不全为零的数 k1,k2,,km\mathbf k_1,\mathbf k_2,\cdots,\mathbf k_m 使得 i=1mkiai=0 \sum\limits_{i=1}^mk_i\mathbf a_i =\mathbf 0则称向量组 AA线性相关的,否则称为线性无关

3.3 向量空间

定义 3.3.1:设 VVnn 为向量的集合,如果集合 VV 非空,且集合 VV 对于向量的假发即数乘两种运算封闭,那么就称集合 VV向量空间
定义 3.3.2:设有向量空间 V1V_1V2V_2,若 V1V2V_1\subseteq V_2,则称 V1V_1V2V_2 的子空间。
定义 3.3.3:设 VV 为向量空间,如果 rr 个向量 a1,a2,,arV\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r\in V,且满足:
  1. a1,a2,,ar\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r 线性无关;
  2. VV 中任一向量都可由 a1,a2,,ar\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r 线性表示,
则称向量组 a1,a2,,ar\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r 为向量空间 VV 的一个rr 称为向量空间 VV维数,并称 VVrr 为向量空间
定义 3.3.4:如果向量空间 VV 中取定一个及 a1,a2,,ar\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r,那么 VV 中任一向量 x\mathbf x 可惟一的表示为x=i=1rλiai\mathbf x=\sum\limits_{i=1}^r\lambda_i\mathbf a_i 数组 λ1,λ2,,λr\lambda_1,\lambda_2,\cdots,\lambda_r 称为向量 x\mathbf x 在基 a1,a2,,ar\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r 的坐标。 特别的,如果在 nn 为向量空间 Rn\mathbb R^n 中取单位坐标向量组 e1,e2,,en\mathbf e_1,\mathbf e_2,\cdots,\mathbf e_n 为基,则以 x1,x2,,xn\mathbf x_1,\mathbf x_2,\cdots,\mathbf x_n 为分量的向量 x\mathbf x 可表示为 x=i=1Nxiei\mathbf x=\sum\limits_{i=1}^N x_i\mathbf e_i

4 相似矩阵及二次型

4.1 向量的内积、长度及正交性

定义 4.1.1:设有 nn 维向量
x=(x1x2xn),y=(y1y2yn)\mathbf x= \begin{pmatrix} x_1\\x_2\\\vdots\\x_n \end{pmatrix} , \mathbf y=\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}
(x,y)=i=1nxiyi(\mathbf x,\mathbf y)=\sum\limits_{i=1}^{n}x_iy_i 称为向量 x\mathbf xy\mathbf y 之间的内积
向量内积运算规则
  1. (x,y)=(y,x)(\mathbf x,\mathbf y)=(\mathbf y,\mathbf x)
  2. (λx,y)=λ(x,y)(\lambda\mathbf x,\mathbf y)=\lambda(\mathbf x,\mathbf y)
  3. (x+y,z)=(x,z)+(y,z)(\mathbf x+\mathbf y,\mathbf z)=(\mathbf x,\mathbf z)+(\mathbf y,\mathbf z)
  4. x=0\mathbf x=\mathbf0 时,(x,x)=0(\mathbf x,\mathbf x)=0;当 x0\mathbf x\neq0 时,(x,x)>0(\mathbf x,\mathbf x)>0
定义 4.1.2:令
x=(x,x)=i=1nxi2\begin{Vmatrix}\mathbf x\end{Vmatrix}=\sqrt{(\mathbf x,\mathbf x)}=\sqrt{\sum\limits_{i=1}^{n}x_i^2}
称为 nn 维向量 x\mathbf x长度(或范数)。 特别的,当x=1\begin{Vmatrix}\mathbf x\end{Vmatrix}=1时,称 x\mathbf x 为单位向量。
定义 4.1.3:设 nn 维向量 e1,e2,,er\mathbf e_1,\mathbf e_2,\cdots,\mathbf e_r 是向量空间 VVVRnV\subseteq\mathbb R^n)的一个基,如果 e1,e2,,er\mathbf e_1,\mathbf e_2,\cdots,\mathbf e_r 两两正交,且都是单位向量,则称 e1,e2,,er\mathbf e_1,\mathbf e_2,\cdots,\mathbf e_rVV 的一个标准正交基
SchmidtSchmidt 正交化
a1,a2,,ar\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r 是向量空间 VV 的一个基,要求 VV 的一个标准正交基。
取:
b1=a1b2=a2(b1,a2)(b1,b1)b1br=ar(b1,ar)(b1,b1)b1(b2,ar)(b2,b2)b2(br1,ar)(br,br)br\mathbf b_1=\mathbf a_1\\\mathbf b_2=\mathbf a_2-\dfrac{(\mathbf b_1,\mathbf a_2)}{(\mathbf b_1,\mathbf b_1)}\mathbf b_1\\\cdots\\\mathbf b_r=\mathbf a_r-\dfrac{(\mathbf b_1,\mathbf a_r)}{(\mathbf b_1,\mathbf b_1)}\mathbf b_1-\dfrac{(\mathbf b_2,\mathbf a_r)}{(\mathbf b_2,\mathbf b_2)}\mathbf b_2-\cdots-\dfrac{(\mathbf b_{r-1},\mathbf a_r)}{(\mathbf b_r,\mathbf b_r)}\mathbf b_r
容易验证 b1,b2,,br\mathbf b_1,\mathbf b_2,\cdots,\mathbf b_r 两两正交
将它们单位化,即
e1=1b1b1,e2=1b2b2,,er=1brbr\mathbf e_1=\dfrac1{\begin{Vmatrix}\mathbf b_1\end{Vmatrix}}\mathbf b_1, \mathbf e_2=\dfrac1{\begin{Vmatrix}\mathbf b_2\end{Vmatrix}}\mathbf b_2, \cdots, \mathbf e_r=\dfrac1{\begin{Vmatrix}\mathbf b_r\end{Vmatrix}}\mathbf b_r
上述过程即称为 SchmidtSchmidt 正交化。
定义 4.1.4:如果 nn 阶矩阵 A\mathbf A 满足
ATA=I   (A1=AT)\mathbf A^{\mathbf T}\mathbf A=\mathbf I\ \ \ (\mathbf A^{-1}=\mathbf A^{\mathbf T})
则称 A\mathbf A正交阵
不难证明方阵 A\mathbf A 为正交阵的充分必要条件是 A\mathbf A 的列向量都是单位向量且两两正交。
正交阵的性质
  1. A\mathbf A 为正交阵,则 A1=AT\mathbf A^{-1}=\mathbf A^{\mathbf T} 也是正交阵,且 A=±1\begin{vmatrix}\mathbf A\end{vmatrix}=\pm1
  2. A\mathbf AB\mathbf B 都是正交阵,则 AB\mathbf A\mathbf B 也是正交阵。
定义 4.1.5:若 P\mathbf P 为正交矩阵,则线性变换 y=Px\mathbf{y=Px} 称为正交变换

4.2 矩阵的特征值与特征向量

定义 4.2.1:设 A\mathbf Ann 阶矩阵,如果数 λ\lambdann 维非零向量 x\mathbf x 使关系式
Ax=λx\mathbf A\mathbf x=\lambda\mathbf x
成立,那么这样的数 λ\lambda 称为矩阵 A\mathbf A特征值,非零向量 x\mathbf x 称为 A\mathbf A 的对应与特征值 λ\lambda特征向量
上式也可化为
AλI=0\begin{vmatrix} \mathbf A-\lambda \mathbf I \end{vmatrix}=\mathbf0
称为矩阵 A\mathbf A特征方程,其左端称为矩阵 A\mathbf A特征多项式
不难证明:
  1. i=1nλi=tr(A)\sum\limits_{i=1}^n \lambda_i=\mathrm{tr}(\mathbf A)
  2. i=1nλi=A\prod\limits_{i=1}^n\lambda_i=\begin{vmatrix}\mathbf A\end{vmatrix}
定义 4.2.2:设 λ\lambda 为矩阵 A\mathbf A 的一个特征值,则由方程
(AλI)x=0\mathbf{(A-\lambda I)x=0}
可求得非零解 x=p\mathbf{x=p},则称 p\mathbf pA\mathbf A 的对应于特征值 λ\lambda特征向量

4.3 相似矩阵

定义 4.3.1:设 A\mathbf AB\mathbf B 都是 nn 阶矩阵,若有可逆矩阵 P\mathbf P 使
P1AP=B\mathbf P^{-1}\mathbf A\mathbf P=\mathbf B
则称 B\mathbf BA\mathbf A相似矩阵,对 A\mathbf A 进行运算 P1AP\mathbf P^{-1}\mathbf A\mathbf P 称为对 A\mathbf A 进行相似变换
矩阵对角化
nn 阶矩阵 A\mathbf A ,寻找相似变换矩阵 P\mathbf P 使得 P1AP=Λ\mathbf P^{-1}\mathbf{AP=\Lambda} 为对角矩阵。
P\mathbf P 用列向量表示为
P=(p1,p2,,pn)\mathbf P=(\mathbf p_1,\mathbf p_2,\cdots,\mathbf p_n)
P1AP=Λ\mathbf P^{-1}\mathbf{AP=\Lambda},得 AP=PΛ\mathbf{AP=P\Lambda},即
A(p1,p2,,pn)=(λ1p1,λ2p2,,λnpn)\mathbf A(\mathbf p_1,\mathbf p_2,\cdots,\mathbf p_n)=(\lambda_1\mathbf p_1,\lambda_2\mathbf p_2,\cdots,\lambda_n\mathbf p_n)
其中已用到
Λ=(λ1λ2λn)\mathbf \Lambda= \begin{pmatrix} \lambda_1& \\ &\lambda_2& \\ &&\ddots& \\ &&&\lambda_n \end{pmatrix}
于是
Api=λipi\mathbf A\mathbf p_i=\lambda_i\mathbf p_i

4.4 对称矩阵的对角化

对称矩阵的性质
  1. 对称矩阵的特征值为实数。
  2. λ1,λ2\lambda_1,\lambda_2 是对称矩阵 A\mathbf A 的两个特征值,p1,p2\mathbf p_1,\mathbf p_2 是对应的特征向量。若 λ1λ2\lambda_1\neq\lambda_2,则 p1\mathbf p_1p2\mathbf p_2 正交。
特别的,对称矩阵 A\mathbf A 存在正交变换矩阵 P\mathbf P 使得 A\mathbf A 经正交变换 P\mathbf P 后变为对角矩阵 Λ\mathbf\Lambda

4.5 二次型及其标准型

定义 4.5.1:含有 nn 个变量 x1,x2,,xnx_1,x_2,\cdots,x_n 的二次齐次函数
f(x1,x2,,xn)=a11x12+a22x22++annxn2+2(a12x1x2+a13x1x3++an1,nxn1xn)f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+a_{22}x_2^2+\cdots+a_{nn}x_n^2+2(a_{12}x_1x_2+a_{13}x_1x_3+\cdots+a_{n-1,n}x_{n-1}x_n)
称为二次型
定义 4.5.2:若二次型中只含平方项,即
f(x)=k1x12+k2x22++knxn2f(x)=k_1x_1^2+k_2x_2^2+\cdots+k_nx_n^2
则称为二次型的标准型(或法式)。
若标准型的系数 k1,k2,,knk_1,k_2,\cdots,k_n 只在 0,1,10,-1,1 中取,则称为二次型的规范型
aija_{ij} 为复数时,称 ff复二次型;当 aija_{ij} 为实数时,称 ff实二次型
利用矩阵,可以将二次型表示为
f=xTAxf=\mathbf {x^TAx}
其中 A\mathbf A 为对称矩阵。
将对称矩阵 A\mathbf A 称为二次型 ff 的矩阵,也将 ff 称为对称矩阵 A\mathbf A 的二次型,对称矩阵 A\mathbf A 的秩也叫做二次型 ff 的秩
定义 4.5.3:设 A\mathbf AB\mathbf Bnn 阶矩阵,若有可逆矩阵 C\mathbf C 使 B=CTAC\mathbf {B=C^TAC},则称矩阵 A\mathbf AB\mathbf B 合同
不难证明:
  1. A\mathbf A 为对称矩阵,则 B\mathbf B 也是对称矩阵;
  2. R(B)=R(A)\mathrm R(\mathbf B)=\mathrm R(\mathbf A)
显然对于给定二次型
f=i,j=1naijxixjf=\sum\limits_{i,j=1}^na_{ij}x_ix_j
总有正交变换 x=Py\mathbf {x=Py} 使 ff 化为标准型
f=i=1nλixi2f=\sum\limits_{i=1}^n\lambda_ix_i^2
其中 λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n 使 ff 的矩阵 A=(aij)\mathbf A=(a_{ij}) 的特征值。

4.6 正定二次型

定义 4.6.1:设二次型 f(x)=xTAxf(\mathbf x)=\mathbf {x^TAx},如果对任何 x0\mathbf {x\neq0},都有 f(x)>0f(\mathbf x)>0 (显然 f(0)=0f(\mathbf 0)=0),则称 ff正定二次型,并称对称矩阵 A\mathbf A 是正定的;如果对任何 x0\mathbf x\neq\mathbf 0 都有 f(x)<0f(\mathbf x)<0,则称 ff负定二次型,并称对称矩阵 A\mathbf A 是负定的
不难发现 nn 元二次型 f=xTAxf=\mathbf {x^TAx} 为正定的充分必要条件是:它的标准型的 nn 个系数全为正,即它的规范型的 nn 个系数全为 11

评论

0 条评论,欢迎与作者交流。

正在加载评论...