线性代数
1 行列式
1.1 n n n 阶行列式
定义 1.1.1 :称以下的式子为一个
n n n 阶行列式:
∣ A ∣ = ∣ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n n ∣ \begin{vmatrix}\mathbf A\end{vmatrix}=
\begin{vmatrix}
a_{11}& a_{12}&\cdots&a_{1n}
\\
a_{21}&a_{22}&\cdots&a_{2n}
\\
\vdots&\vdots&\ddots&\vdots
\\
a_{n1}&a_{n2}&\cdots&a_{nn}
\end{vmatrix} A = a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a nn
其中第
i i i 行第
j j j 列的元素成为行列式
∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A 的第
( i , j ) (i,j) ( i , j ) 元素。
元素
a 11 , a 22 , ⋯ , a n n a_{11},a_{22},\cdots,a_{nn} a 11 , a 22 , ⋯ , a nn 称为
∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A 的主对角线。
性质 1 :上三角行列式的值等于其对角线元素之和。
性质 2 :行列式某行(列)全为零,则行列式的值等于零。
性质 3 :用常数
c c c 乘以行列式的某一行(列),得到的行列式的值等于原行列式的值的
c c c 倍。
性质 4 :交换行列式不同的两行(列),行列式的值变号。
性质 5 :若行列式两行(列)成比例,则行列式的值为零。
性质 6 :若行列式中某行(列)元素均为两项之和,则行列式可表示为两个行列式之和。
性质 7 :行列式的某一行(列)乘以某个数加到另一行(列)上,行列式的值不变。
性质 8 :行列式和其转置有相同的值。
定义 1.1.2 :定义元素
a i j a_{ij} a ij 的
余子式 M i j M_{ij} M ij 为由其行列式
∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A 中划去第
i i i 行第
j j j 列后剩下的元素组成的行列式。
定义 1.1.3 :在行列式
∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A 中,
a i j a_{ij} a ij 的
代数余子式 定义为:
A i j = ( − 1 ) i + j M i j A_{ij} = (-1)^{i+j}M_{ij} A ij = ( − 1 ) i + j M ij ,其中
M i j M_{ij} M ij 为
a i j a_{ij} a ij 的余子式。
1.2 行列式的展开
设
∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A 是
n n n 阶行列式,元素
a i j a_{ij} a ij 的代数余子式记为
A i j A_{ij} A ij ,则对任意
s , r ( = 1 , 2 , ⋯ , n ) , s ≠ r s,r(=1,2,\cdots,n),s\neq r s , r ( = 1 , 2 , ⋯ , n ) , s = r 存在:
∣ A ∣ = ∑ i = 1 n a i r A i r ∑ i = 1 n a i r A i s = 0 \begin{vmatrix}\mathbf A\end{vmatrix}=\sum\limits_{i=1}^n a_{ir}A_{ir}
\\
\sum\limits_{i=1}^n a_{ir}A_{is}=0 A = i = 1 ∑ n a i r A i r i = 1 ∑ n a i r A i s = 0
1.3 Cramer 法则
设线性方程组:
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯ a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n = b n \begin{cases}
a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1
\\
a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2
\\
\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots
\\
a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n=b_n
\end{cases} ⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯ a n 1 x 1 + a n 2 x 2 + ⋯ + a nn x n = b n
记其
系数行列式 为
∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A ,则:
x 1 = ∣ A 1 ∣ ∣ A ∣ , x 2 = ∣ A 2 ∣ ∣ A ∣ , ⋯ , x n = ∣ A n ∣ ∣ A ∣ x_1=\dfrac{\begin{vmatrix}\mathbf A_1\end{vmatrix}}{\begin{vmatrix}\mathbf A\end{vmatrix}},x_2=\dfrac{\begin{vmatrix}\mathbf A_2\end{vmatrix}}{\begin{vmatrix}\mathbf A\end{vmatrix}},\cdots,x_n=\dfrac{\begin{vmatrix}\mathbf A_n\end{vmatrix}}{\begin{vmatrix}\mathbf A\end{vmatrix}} x 1 = A A 1 , x 2 = A A 2 , ⋯ , x n = A A n
其中
∣ A j ∣ \begin{vmatrix}\mathbf A_j\end{vmatrix} A j 为
∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A 去掉第
j j j 列并用
b 1 , b 2 , ⋯ , b n b_1,b_2,\cdots,b_n b 1 , b 2 , ⋯ , b n 将之替换的
n n n 阶行列式。
2 矩阵
2.1 矩阵的概念
定义 2.1.1 :由
m n mn mn 个数
a i j ( i = 1 , 2 , ⋯ , m ; j = 1 , 2 , ⋯ n ) a_{ij}(i=1,2,\cdots,m;j=1,2,\cdots n) a ij ( i = 1 , 2 , ⋯ , m ; j = 1 , 2 , ⋯ n ) 排成
m m m 行
n n n 列的矩形阵列:
a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n n \begin{matrix}
a_{11}&a_{12}&\cdots&a_{1n}
\\
a_{21}&a_{22}&\cdots&a_{2n}
\\
\vdots&\vdots&\ddots&\vdots
\\
a_{n1}&a_{n2}&\cdots&a_{nn}
\\
\end{matrix} a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a nn
称为
m m m 行
n n n 列矩阵,简称为
m × n m\times n m × n 矩阵(或
m × n m\times n m × n 阵)。
若
A \mathbf A A 的元素全是实数则称
A \mathbf A A 为
实矩阵 。
若
A \mathbf A A 的元素全是复数则称
A \mathbf A A 为
复矩阵 。
若所有元素均为
0 0 0 则称为
零矩阵 O \mathrm O O ,或
O m × n \mathrm O_{m\times n} O m × n 。
若
m = n m=n m = n 则称为
方阵 ,反之为
长方阵 。
若方阵
A \mathbf A A 仅存在对角元
a 11 , a 22 , ⋯ , a n n a_{11},a_{22},\cdots,a_{nn} a 11 , a 22 , ⋯ , a nn 则简记为
A = d i a g ( a 11 , a 22 , ⋯ , a n n ) \mathbf A=\mathbf{diag}(a_{11},a_{22},\cdots,a_{nn}) A = diag ( a 11 , a 22 , ⋯ , a nn ) 。
进一步,若
a 11 = a 22 = ⋯ = a n n = 1 a_{11}=a_{22}=\cdots=a_{nn}=1 a 11 = a 22 = ⋯ = a nn = 1 则称
I n = d i a g ( 1 , 1 , ⋯ , 1 ) \mathbf {I_n}=\mathbf{diag}(1,1,\cdots,1) I n = diag ( 1 , 1 , ⋯ , 1 ) 为
n n n 阶单位矩阵。
2.2 矩阵的运算
一、矩阵加减法
定义 2.2.1 :设有两个
m × n m\times n m × n 矩阵
A = ( a i j ) , B = ( b i j ) \mathbf A=(a_{ij}),\mathbf B=(b_{ij}) A = ( a ij ) , B = ( b ij ) ,定义
A + B \mathbf A+\mathbf B A + B 是一个
m × n m\times n m × n 矩阵且
A + B \mathbf A+\mathbf B A + B 的第
( i , j ) (i,j) ( i , j ) 元素等于
a i j + b i j a_{ij}+b_{ij} a ij + b ij ,即
A + B = ( a i j + b i j ) \mathbf A+\mathbf B=(a_{ij}+b_{ij}) A + B = ( a ij + b ij )
矩阵的减法可看作矩阵加法的逆运算,即
A − B = ( a i j − b i j ) \mathbf A-\mathbf B=(a_{ij}-b_{ij}) A − B = ( a ij − b ij )
定义 2.2.2 :定义
A = ( a i j ) \mathbf A=(a_{ij}) A = ( a ij ) 的负矩阵为
− A = ( − a i j ) -\mathbf A=(-a_{ij}) − A = ( − a ij ) ,则有
A + ( − A ) = O \mathbf A+(-\mathbf A)=\mathbf O A + ( − A ) = O 。
矩阵加减法运算规则 :
交换律:A + B = B + A \mathbf A+\mathbf B=\mathbf B+\mathbf A A + B = B + A 。
结合律:( A + B ) + C = A + ( B + C ) (\mathbf A+\mathbf B)+\mathbf C=\mathbf A+(\mathbf B+\mathbf C) ( A + B ) + C = A + ( B + C ) 。
O + A = A + O = A \mathbf O+\mathbf A=\mathbf A+\mathbf O=\mathbf A O + A = A + O = A 。
A + ( − B ) = A − B \mathbf A+(-\mathbf B)=\mathbf A-\mathbf B A + ( − B ) = A − B 。
二、矩阵的数乘
定义 2.2.3 :设
A \mathbf A A 是一个
m × n m\times n m × n 矩阵,
A = ( a i j ) m × n \mathbf A=(a_{ij})_{m\times n} A = ( a ij ) m × n ,
c c c 是一个常数,定义
c A = ( c a i j ) m × n c\mathbf A=(ca_{ij})_{m\times n} c A = ( c a ij ) m × n 。
c A c\mathbf A c A 称为数
c A c\mathbf A c A 的数乘。
矩阵的数乘运算规则 :
c ( A + B ) = c A + c B c(\mathbf A+\mathbf B)=c\mathbf A+c\mathbf B c ( A + B ) = c A + c B 。
( c + d ) A = c A + d A (c+d)\mathbf A=c\mathbf A+d\mathbf A ( c + d ) A = c A + d A 。
( c d ) A = c ( d A ) (cd)\mathbf A=c(d\mathbf A) ( c d ) A = c ( d A ) 。
1 ⋅ A = A 1\cdot\mathbf A=\mathbf A 1 ⋅ A = A 。
0 ⋅ A = O 0\cdot\mathbf A=\mathbf O 0 ⋅ A = O 。
三、矩阵的乘法
定义 2.2.4 :设有
m × k m\times k m × k 矩阵
A = ( a i j ) m × k \mathbf A=(a_{ij})_{m\times k} A = ( a ij ) m × k ,以及
k × n k\times n k × n 矩阵
B = ( b i j ) m × n \mathbf B=(b_{ij})_{m\times n} B = ( b ij ) m × n 。定义
A \mathbf A A 和
B \mathbf B B 的乘积
A B \mathbf A\mathbf B AB 是一个
m × n m\times n m × n 矩阵且
A B \mathbf A\mathbf B AB 的第
( i , j ) (i,j) ( i , j ) 元素
c i j = ∑ l = 1 k a i l b l j c_{ij}=\sum\limits_{l=1}^ka_{il}b_{lj} c ij = l = 1 ∑ k a i l b l j
矩阵乘法的运算规则 :
结合律:( A B ) C = A ( B C ) (\mathbf A\mathbf B)\mathbf C=\mathbf A(\mathbf B\mathbf C) ( AB ) C = A ( BC ) 。
左右分配律:A ( B + C ) = A B + A C , ( A + B ) C = A C + B C \mathbf A(\mathbf B+\mathbf C)=\mathbf A\mathbf B+\mathbf A\mathbf C,(\mathbf A+\mathbf B)\mathbf C=\mathbf A\mathbf C+\mathbf B\mathbf C A ( B + C ) = AB + AC , ( A + B ) C = AC + BC 。
c ( A B ) = ( c A ) B = A ( c B ) c(\mathbf A\mathbf B)=(c\mathbf A)\mathbf B=\mathbf A(c\mathbf B) c ( AB ) = ( c A ) B = A ( c B ) 。
对任意的 m × n m\times n m × n 矩阵 A \mathbf A A ,I m A = A = A I n \mathbf {I_m}\mathbf A=\mathbf A=\mathbf A\mathbf {I_n} I m A = A = A I n 。
方阵幂运算规则 :
A r A s = A r + s \mathbf A^r\mathbf A^s=\mathbf A^{r+s} A r A s = A r + s 。
( A r ) s = A r s (\mathbf A^r)^s=\mathbf A^{rs} ( A r ) s = A rs 。
四、矩阵的转置
定义 2.2.5 :设
A = ( a i j ) \mathbf A=(a_{ij}) A = ( a ij ) 是
m × n m\times n m × n 矩阵,定义
A \mathbf A A 的转置
A T \mathbf A^{\mathbf T} A T 为一个
n × m n\times m n × m 矩阵,它的第
k k k 行正好是矩阵
A \mathbf A A 的第
k k k 列(
k = 1 , 2 , ⋯ , n k=1,2,\cdots,n k = 1 , 2 , ⋯ , n );它的第
r r r 行是
A \mathbf A A 的第
r r r 行(
r = 1 , 2 , ⋯ , n r=1,2,\cdots,n r = 1 , 2 , ⋯ , n )。
矩阵转置运算规则 :
( A T ) T = A (\mathbf A^{\mathbf T})^{\mathbf T}=\mathbf A ( A T ) T = A 。
( A + B ) T = A T + B T (\mathbf A+\mathbf B)^{\mathbf T}=\mathbf A^{\mathbf T}+\mathbf B^{\mathbf T} ( A + B ) T = A T + B T 。
( c A ) T = c A T (c\mathbf A)^{\mathbf T}=c\mathbf A^{\mathbf T} ( c A ) T = c A T 。
( A B ) T = B T A T (\mathbf A\mathbf B)^{\mathbf T}=\mathbf B^{\mathbf T}\mathbf A^{\mathbf T} ( AB ) T = B T A T 。
五、矩阵的共轭
定义 2.2.6 :设
A = ( a i j ) m × n \mathbf A=(a_{ij})_{m\times n} A = ( a ij ) m × n 是一个复矩阵,则
A \mathbf A A 的
共轭矩阵 A ‾ \overline{\mathbf A} A 是一个
m × n m\times n m × n 复矩阵,且
A ‾ = ( a ‾ i j ) m × n \overline{\mathbf A}=(\overline a_{ij})_{m\times n} A = ( a ij ) m × n
矩阵共轭运算规则 :
A + B ‾ = A ‾ + B ‾ \overline{\mathbf A+\mathbf B}=\overline {\mathbf A}+\overline {\mathbf B} A + B = A + B 。
c A ‾ = c ‾ A ‾ \overline{c\mathbf A}=\overline c \overline {\mathbf A} c A = c A 。
A B ‾ = A ‾ B ‾ \overline{\mathbf A \mathbf B}=\overline{\mathbf A}\ \overline {\mathbf B} AB = A B 。
( A T ) ‾ = ( A ‾ ) T \overline{({\mathbf A}^{\mathbf T})}=(\overline{\mathbf A})^{\mathbf T} ( A T ) = ( A ) T 。
六、矩阵的迹
定义 2.2.7 :设
A \mathbf A A 是一个
n n n 阶方阵,则
A \mathbf A A 的
迹 为
t r ( A ) = ∑ i = 1 n a i i \mathrm{tr}(\mathbf A)=\sum\limits_{i=1}^na_{ii} tr ( A ) = i = 1 ∑ n a ii
2.3 方阵的逆阵
定义 2.3.1 :设
A \mathbf A A 是
n n n 阶方阵,若存在一个
n n n 阶方阵
B \mathbf B B ,使得:
A B = B A = I n , \mathbf A\mathbf B=\mathbf B\mathbf A=\mathbf {I_n}, AB = BA = I n ,
则称
B \mathbf B B 是
A \mathbf A A 的
逆阵 ,记为
B = A − 1 \mathbf B=\mathbf A^{-1} B = A − 1 。凡有逆阵的矩阵称为
可逆阵 或
非奇异阵 (简称
非异阵 ),否则称为
奇异阵 。
矩阵求逆运算规则 :
若 A \mathbf A A 是非异阵,则 ( A − 1 ) − 1 = A (\mathbf A^{-1})^{-1}=\mathbf A ( A − 1 ) − 1 = A 。
若 A , B \mathbf A,\mathbf B A , B 都是 n n n 阶非异阵,则 A B \mathbf A\mathbf B AB 也是 n n n 阶非异阵且 ( A B ) − 1 = B − 1 A − 1 (\mathbf A\mathbf B)^{-1}=\mathbf B^{-1}\mathbf A^{-1} ( AB ) − 1 = B − 1 A − 1 。
若 A \mathbf A A 是非异阵,c c c 是非零数,则 c A c\mathbf A c A 也是非异阵且 ( c A ) − 1 = c − 1 A − 1 (c\mathbf A)^{-1}=c^{-1}\mathbf A^{-1} ( c A ) − 1 = c − 1 A − 1 。
若 A \mathbf A A 是非异阵,则 A \mathbf A A 的转置 A T \mathbf A^{\mathbf T} A T 也是非异阵且 ( A T ) − 1 = ( A − 1 ) T (\mathbf A^{\mathbf T})^{-1}=(\mathbf A^{-1})^{\mathbf T} ( A T ) − 1 = ( A − 1 ) T 。
设
A \mathbf A A 是
n n n 阶方阵,这个方阵决定了一个
n n n 阶行列式,记为
∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A 或
det A \det\mathbf A det A 。
定义 2.3.2 :设
A A A 是
n n n 阶方阵,
A i j A_{ij} A ij 是行列式
∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A 中第
( i , j ) (i,j) ( i , j ) 元素
a i j a_{ij} a ij 的代数余子式,则称下列方阵为
A \mathbf A A 的
伴随阵 :
( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ) \begin{pmatrix}
A_{11}&A_{21}&\cdots &A_{n1}
\\
A_{12}&A_{22}&\cdots &A_{n2}
\\
\vdots&\vdots&\ddots &\vdots
\\
A_{1n}&A_{2n}&\cdots &A_{nn}
\end{pmatrix} A 11 A 12 ⋮ A 1 n A 21 A 22 ⋮ A 2 n ⋯ ⋯ ⋱ ⋯ A n 1 A n 2 ⋮ A nn
A \mathbf A A 的伴随阵通常记为
A ∗ \mathbf {A^*} A ∗ 。
引理 2.3.1 :设
A \mathbf A A 为
n n n 阶方阵,
A ∗ \mathbf A^* A ∗ 为
A \mathbf A A 的伴随阵,则
A A ∗ = A ∗ A = ∣ A ∣ ⋅ I n \mathbf A\mathbf A^*=\mathbf A^*\mathbf A=\begin{vmatrix}\mathbf A\end{vmatrix}\cdot\mathbf{I_{n}} A A ∗ = A ∗ A = A ⋅ I n
定理 2.3.1 :若
∣ A ∣ ≠ 0 \begin{vmatrix}\mathbf A\end{vmatrix}\neq0 A = 0 ,则
A \mathbf A A 是一个非异阵,且
A − 1 = 1 ∣ A ∣ A ∗ \mathbf A^{-1}=\dfrac{1}{\begin{vmatrix}\mathbf A\end{vmatrix}} \mathbf A^* A − 1 = A 1 A ∗
2.4 矩阵的初等变换与初等矩阵
定义 2.4.1 :下列三种矩阵变换分别称为矩阵的第一类、第二类、第三类初等行(列)变换:
对调矩阵中某两行(列)的位置;
用一非零常数 c c c 乘以矩阵的某一行(列);
将矩阵的某一行(列)乘以常数 c c c 后加到另一行(列)上去。
2.5 初等变换法求逆阵
众所周知,用伴随阵求非异阵的逆阵是相当麻烦的,有没有什么更加强势的做法推荐一下:
有的兄弟有的:
A − 1 A = I n A − 1 = A − 1 I n \mathbf A^{-1}\mathbf A=\mathbf {I_n}
\\
\mathbf A^{-1}=\mathbf A^{-1}\mathbf {I_n} A − 1 A = I n A − 1 = A − 1 I n
上述和式子启发我们可以这样求逆阵:
考虑一个
n × 2 n n\times 2n n × 2 n 的矩阵
( A I n ) (\mathbf A\mathbf {I_n}) ( A I n ) ,这个矩阵的前
n n n 列为
A \mathbf A A ,后
n n n 列为
I n \mathbf {I_n} I n 。对矩阵
( A I n ) (\mathbf A\mathbf {I_n}) ( A I n ) 进行初等变换把
A \mathbf A A 变成
I n \mathbf {I_n} I n ,这时右边的
I n \mathbf {I_n} I n 就变成了
A − 1 \mathbf A^{-1} A − 1 。
2.6 矩阵的秩
定义 2.6.1 :在
m × n m\times n m × n 矩阵
A \mathbf A A 中,任取
k k k 行
k k k 列(
k ⩽ m , k ⩽ n k\leqslant m,k\leqslant n k ⩽ m , k ⩽ n ),位于这些行列交叉处的
k 2 k^2 k 2 个元素,不改变他们在
A \mathbf A A 中所处的位置次序二得的
k k k 阶行列式,称为
矩阵 A \mathbf A A 的 k k k 阶子式 。
定义 2.6.2 :设在矩阵
A \mathbf A A 中有一个不等于
0 0 0 的
r r r 阶子式
D \mathbf D D ,且所有
r + 1 r+1 r + 1 阶子式(如果存在的话)全等于
0 0 0 ,则
D \mathbf D D 称为矩阵
A \mathbf A A 的
最高阶非零子式 ,数
r r r 称为
矩阵 A \mathbf A A 的秩 ,记作
R ( A ) \text R(\mathbf A) R ( A ) 。并规定零矩阵的秩为
0 0 0 。
3 向量组的线性相关性
3.1 向量组及其线性组合
定义 3.1.1 :
n n n 个有次序的数
a 1 , a 2 , ⋯ , a n a_1,a_2,\cdots,a_n a 1 , a 2 , ⋯ , a n 所组成的数组称为
n n n 维向量,这
n n n 个数称为该向量的
n n n 个分量,第
i i i 个数
a i a_i a i 称为第
i i i 个分量。
定义3.1.2 :给定向量组
A : a 1 , a 2 , ⋯ , a m A:\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_m A : a 1 , a 2 , ⋯ , a m ,对于任何一组实数
k 1 , k 2 , ⋯ , k m k_1,k_2,\cdots,k_m k 1 , k 2 , ⋯ , k m ,表达式
∑ i = 1 m k i a i \sum\limits_{i=1}^{m}k_i\mathbf a_i i = 1 ∑ m k i a i 称为向量组
A A A 的一个线性组合,
k 1 , k 2 , ⋯ , k n k_1,k_2,\cdots,k_n k 1 , k 2 , ⋯ , k n 称为这个线性组合的系数。
3.2 向量组的线性相关性
定义 3.2.1 :给定向量组
A : a 1 , a 2 , ⋯ , a m A:\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_m A : a 1 , a 2 , ⋯ , a m ,如果存在不全为零的数
k 1 , k 2 , ⋯ , k m \mathbf k_1,\mathbf k_2,\cdots,\mathbf k_m k 1 , k 2 , ⋯ , k m 使得
∑ i = 1 m k i a i = 0 \sum\limits_{i=1}^mk_i\mathbf a_i =\mathbf 0 i = 1 ∑ m k i a i = 0 则称向量组
A A A 是
线性相关 的,否则称为
线性无关 。
3.3 向量空间
定义 3.3.1 :设
V V V 为
n n n 为向量的集合,如果集合
V V V 非空,且集合
V V V 对于向量的假发即数乘两种运算封闭,那么就称集合
V V V 为
向量空间 。
定义 3.3.2 :设有向量空间
V 1 V_1 V 1 及
V 2 V_2 V 2 ,若
V 1 ⊆ V 2 V_1\subseteq V_2 V 1 ⊆ V 2 ,则称
V 1 V_1 V 1 是
V 2 V_2 V 2 的子空间。
定义 3.3.3 :设
V V V 为向量空间,如果
r r r 个向量
a 1 , a 2 , ⋯ , a r ∈ V \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r\in V a 1 , a 2 , ⋯ , a r ∈ V ,且满足:
a 1 , a 2 , ⋯ , a r \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r a 1 , a 2 , ⋯ , a r 线性无关;
V V V 中任一向量都可由 a 1 , a 2 , ⋯ , a r \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r a 1 , a 2 , ⋯ , a r 线性表示,
则称向量组
a 1 , a 2 , ⋯ , a r \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r a 1 , a 2 , ⋯ , a r 为向量空间
V V V 的一个
基 ,
r r r 称为向量空间
V V V 的
维数 ,并称
V V V 为
r r r 为向量空间。
定义 3.3.4 :如果向量空间
V V V 中取定一个及
a 1 , a 2 , ⋯ , a r \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r a 1 , a 2 , ⋯ , a r ,那么
V V V 中任一向量
x \mathbf x x 可惟一的表示为
x = ∑ i = 1 r λ i a i \mathbf x=\sum\limits_{i=1}^r\lambda_i\mathbf a_i x = i = 1 ∑ r λ i a i 数组
λ 1 , λ 2 , ⋯ , λ r \lambda_1,\lambda_2,\cdots,\lambda_r λ 1 , λ 2 , ⋯ , λ r 称为向量
x \mathbf x x 在基
a 1 , a 2 , ⋯ , a r \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r a 1 , a 2 , ⋯ , a r 的坐标。
特别的,如果在
n n n 为向量空间
R n \mathbb R^n R n 中取单位坐标向量组
e 1 , e 2 , ⋯ , e n \mathbf e_1,\mathbf e_2,\cdots,\mathbf e_n e 1 , e 2 , ⋯ , e n 为基,则以
x 1 , x 2 , ⋯ , x n \mathbf x_1,\mathbf x_2,\cdots,\mathbf x_n x 1 , x 2 , ⋯ , x n 为分量的向量
x \mathbf x x 可表示为
x = ∑ i = 1 N x i e i \mathbf x=\sum\limits_{i=1}^N x_i\mathbf e_i x = i = 1 ∑ N x i e i
4 相似矩阵及二次型
4.1 向量的内积、长度及正交性
x = ( x 1 x 2 ⋮ x n ) , y = ( y 1 y 2 ⋮ y n ) \mathbf x=
\begin{pmatrix}
x_1\\x_2\\\vdots\\x_n
\end{pmatrix}
,
\mathbf y=\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix} x = x 1 x 2 ⋮ x n , y = y 1 y 2 ⋮ y n
记
( x , y ) = ∑ i = 1 n x i y i (\mathbf x,\mathbf y)=\sum\limits_{i=1}^{n}x_iy_i ( x , y ) = i = 1 ∑ n x i y i
称为向量
x \mathbf x x 与
y \mathbf y y 之间的
内积 。
向量内积运算规则 :
( x , y ) = ( y , x ) (\mathbf x,\mathbf y)=(\mathbf y,\mathbf x) ( x , y ) = ( y , x ) ;
( λ x , y ) = λ ( x , y ) (\lambda\mathbf x,\mathbf y)=\lambda(\mathbf x,\mathbf y) ( λ x , y ) = λ ( x , y ) ;
( x + y , z ) = ( x , z ) + ( y , z ) (\mathbf x+\mathbf y,\mathbf z)=(\mathbf x,\mathbf z)+(\mathbf y,\mathbf z) ( x + y , z ) = ( x , z ) + ( y , z ) ;
当 x = 0 \mathbf x=\mathbf0 x = 0 时,( x , x ) = 0 (\mathbf x,\mathbf x)=0 ( x , x ) = 0 ;当 x ≠ 0 \mathbf x\neq0 x = 0 时,( x , x ) > 0 (\mathbf x,\mathbf x)>0 ( x , x ) > 0 。
定义 4.1.2 :令
∥ x ∥ = ( x , x ) = ∑ i = 1 n x i 2 \begin{Vmatrix}\mathbf x\end{Vmatrix}=\sqrt{(\mathbf x,\mathbf x)}=\sqrt{\sum\limits_{i=1}^{n}x_i^2} x = ( x , x ) = i = 1 ∑ n x i 2
称为
n n n 维向量
x \mathbf x x 的
长度 (或
范数 )。
特别的,当
∥ x ∥ = 1 \begin{Vmatrix}\mathbf x\end{Vmatrix}=1 x = 1 时,称
x \mathbf x x 为单位向量。
定义 4.1.3 :设
n n n 维向量
e 1 , e 2 , ⋯ , e r \mathbf e_1,\mathbf e_2,\cdots,\mathbf e_r e 1 , e 2 , ⋯ , e r 是向量空间
V V V (
V ⊆ R n V\subseteq\mathbb R^n V ⊆ R n )的一个基,如果
e 1 , e 2 , ⋯ , e r \mathbf e_1,\mathbf e_2,\cdots,\mathbf e_r e 1 , e 2 , ⋯ , e r 两两正交,且都是单位向量,则称
e 1 , e 2 , ⋯ , e r \mathbf e_1,\mathbf e_2,\cdots,\mathbf e_r e 1 , e 2 , ⋯ , e r 是
V V V 的一个
标准正交基 。
S c h m i d t Schmidt S c hmi d t 正交化
设
a 1 , a 2 , ⋯ , a r \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r a 1 , a 2 , ⋯ , a r 是向量空间
V V V 的一个基,要求
V V V 的一个标准正交基。
取:
b 1 = a 1 b 2 = a 2 − ( b 1 , a 2 ) ( b 1 , b 1 ) b 1 ⋯ b r = a r − ( b 1 , a r ) ( b 1 , b 1 ) b 1 − ( b 2 , a r ) ( b 2 , b 2 ) b 2 − ⋯ − ( b r − 1 , a r ) ( b r , b r ) b r \mathbf b_1=\mathbf a_1\\\mathbf b_2=\mathbf a_2-\dfrac{(\mathbf b_1,\mathbf a_2)}{(\mathbf b_1,\mathbf b_1)}\mathbf b_1\\\cdots\\\mathbf b_r=\mathbf a_r-\dfrac{(\mathbf b_1,\mathbf a_r)}{(\mathbf b_1,\mathbf b_1)}\mathbf b_1-\dfrac{(\mathbf b_2,\mathbf a_r)}{(\mathbf b_2,\mathbf b_2)}\mathbf b_2-\cdots-\dfrac{(\mathbf b_{r-1},\mathbf a_r)}{(\mathbf b_r,\mathbf b_r)}\mathbf b_r b 1 = a 1 b 2 = a 2 − ( b 1 , b 1 ) ( b 1 , a 2 ) b 1 ⋯ b r = a r − ( b 1 , b 1 ) ( b 1 , a r ) b 1 − ( b 2 , b 2 ) ( b 2 , a r ) b 2 − ⋯ − ( b r , b r ) ( b r − 1 , a r ) b r
容易验证
b 1 , b 2 , ⋯ , b r \mathbf b_1,\mathbf b_2,\cdots,\mathbf b_r b 1 , b 2 , ⋯ , b r 两两正交
将它们单位化,即
e 1 = 1 ∥ b 1 ∥ b 1 , e 2 = 1 ∥ b 2 ∥ b 2 , ⋯ , e r = 1 ∥ b r ∥ b r \mathbf e_1=\dfrac1{\begin{Vmatrix}\mathbf b_1\end{Vmatrix}}\mathbf b_1,
\mathbf e_2=\dfrac1{\begin{Vmatrix}\mathbf b_2\end{Vmatrix}}\mathbf b_2,
\cdots,
\mathbf e_r=\dfrac1{\begin{Vmatrix}\mathbf b_r\end{Vmatrix}}\mathbf b_r e 1 = b 1 1 b 1 , e 2 = b 2 1 b 2 , ⋯ , e r = b r 1 b r
上述过程即称为
S c h m i d t Schmidt S c hmi d t 正交化。
定义 4.1.4 :如果
n n n 阶矩阵
A \mathbf A A 满足
A T A = I ( A − 1 = A T ) \mathbf A^{\mathbf T}\mathbf A=\mathbf I\ \ \ (\mathbf A^{-1}=\mathbf A^{\mathbf T}) A T A = I ( A − 1 = A T )
不难证明方阵
A \mathbf A A 为正交阵的充分必要条件是
A \mathbf A A 的列向量都是单位向量且两两正交。
正交阵的性质 :
若 A \mathbf A A 为正交阵,则 A − 1 = A T \mathbf A^{-1}=\mathbf A^{\mathbf T} A − 1 = A T 也是正交阵,且 ∣ A ∣ = ± 1 \begin{vmatrix}\mathbf A\end{vmatrix}=\pm1 A = ± 1 ;
若 A \mathbf A A 和 B \mathbf B B 都是正交阵,则 A B \mathbf A\mathbf B AB 也是正交阵。
定义 4.1.5 :若
P \mathbf P P 为正交矩阵,则线性变换
y = P x \mathbf{y=Px} y = Px 称为
正交变换 。
4.2 矩阵的特征值与特征向量
定义 4.2.1 :设
A \mathbf A A 是
n n n 阶矩阵,如果数
λ \lambda λ 和
n n n 维非零向量
x \mathbf x x 使关系式
A x = λ x \mathbf A\mathbf x=\lambda\mathbf x Ax = λ x
成立,那么这样的数
λ \lambda λ 称为矩阵
A \mathbf A A 的
特征值 ,非零向量
x \mathbf x x 称为
A \mathbf A A 的对应与特征值
λ \lambda λ 的
特征向量 。
上式也可化为
∣ A − λ I ∣ = 0 \begin{vmatrix} \mathbf A-\lambda \mathbf I \end{vmatrix}=\mathbf0 A − λ I = 0
称为矩阵
A \mathbf A A 的
特征方程 ,其左端称为矩阵
A \mathbf A A 的
特征多项式 。
不难证明:
∑ i = 1 n λ i = t r ( A ) \sum\limits_{i=1}^n \lambda_i=\mathrm{tr}(\mathbf A) i = 1 ∑ n λ i = tr ( A ) ;
∏ i = 1 n λ i = ∣ A ∣ \prod\limits_{i=1}^n\lambda_i=\begin{vmatrix}\mathbf A\end{vmatrix} i = 1 ∏ n λ i = A 。
定义 4.2.2 :设
λ \lambda λ 为矩阵
A \mathbf A A 的一个特征值,则由方程
( A − λ I ) x = 0 \mathbf{(A-\lambda I)x=0} ( A − λ I ) x = 0
可求得非零解
x = p \mathbf{x=p} x = p ,则称
p \mathbf p p 为
A \mathbf A A 的对应于特征值
λ \lambda λ 的
特征向量 。
4.3 相似矩阵
定义 4.3.1 :设
A \mathbf A A 、
B \mathbf B B 都是
n n n 阶矩阵,若有可逆矩阵
P \mathbf P P 使
P − 1 A P = B \mathbf P^{-1}\mathbf A\mathbf P=\mathbf B P − 1 AP = B
则称
B \mathbf B B 是
A \mathbf A A 的
相似矩阵 ,对
A \mathbf A A 进行运算
P − 1 A P \mathbf P^{-1}\mathbf A\mathbf P P − 1 AP 称为对
A \mathbf A A 进行
相似变换 。
矩阵对角化
对
n n n 阶矩阵
A \mathbf A A ,寻找相似变换矩阵
P \mathbf P P 使得
P − 1 A P = Λ \mathbf P^{-1}\mathbf{AP=\Lambda} P − 1 AP = Λ 为对角矩阵。
P = ( p 1 , p 2 , ⋯ , p n ) \mathbf P=(\mathbf p_1,\mathbf p_2,\cdots,\mathbf p_n) P = ( p 1 , p 2 , ⋯ , p n )
由
P − 1 A P = Λ \mathbf P^{-1}\mathbf{AP=\Lambda} P − 1 AP = Λ ,得
A P = P Λ \mathbf{AP=P\Lambda} AP = PΛ ,即
A ( p 1 , p 2 , ⋯ , p n ) = ( λ 1 p 1 , λ 2 p 2 , ⋯ , λ n p n ) \mathbf A(\mathbf p_1,\mathbf p_2,\cdots,\mathbf p_n)=(\lambda_1\mathbf p_1,\lambda_2\mathbf p_2,\cdots,\lambda_n\mathbf p_n) A ( p 1 , p 2 , ⋯ , p n ) = ( λ 1 p 1 , λ 2 p 2 , ⋯ , λ n p n )
其中已用到
Λ = ( λ 1 λ 2 ⋱ λ n ) \mathbf \Lambda=
\begin{pmatrix}
\lambda_1&
\\
&\lambda_2&
\\
&&\ddots&
\\
&&&\lambda_n
\end{pmatrix} Λ = λ 1 λ 2 ⋱ λ n
于是
A p i = λ i p i \mathbf A\mathbf p_i=\lambda_i\mathbf p_i A p i = λ i p i
4.4 对称矩阵的对角化
对称矩阵的性质 :
对称矩阵的特征值为实数。
设 λ 1 , λ 2 \lambda_1,\lambda_2 λ 1 , λ 2 是对称矩阵 A \mathbf A A 的两个特征值,p 1 , p 2 \mathbf p_1,\mathbf p_2 p 1 , p 2 是对应的特征向量。若 λ 1 ≠ λ 2 \lambda_1\neq\lambda_2 λ 1 = λ 2 ,则 p 1 \mathbf p_1 p 1 与 p 2 \mathbf p_2 p 2 正交。
特别的,对称矩阵
A \mathbf A A 存在正交变换矩阵
P \mathbf P P 使得
A \mathbf A A 经正交变换
P \mathbf P P 后变为对角矩阵
Λ \mathbf\Lambda Λ 。
4.5 二次型及其标准型
定义 4.5.1 :含有
n n n 个变量
x 1 , x 2 , ⋯ , x n x_1,x_2,\cdots,x_n x 1 , x 2 , ⋯ , x n 的二次齐次函数
f ( x 1 , x 2 , ⋯ , x n ) = a 11 x 1 2 + a 22 x 2 2 + ⋯ + a n n x n 2 + 2 ( a 12 x 1 x 2 + a 13 x 1 x 3 + ⋯ + a n − 1 , n x n − 1 x n ) f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+a_{22}x_2^2+\cdots+a_{nn}x_n^2+2(a_{12}x_1x_2+a_{13}x_1x_3+\cdots+a_{n-1,n}x_{n-1}x_n) f ( x 1 , x 2 , ⋯ , x n ) = a 11 x 1 2 + a 22 x 2 2 + ⋯ + a nn x n 2 + 2 ( a 12 x 1 x 2 + a 13 x 1 x 3 + ⋯ + a n − 1 , n x n − 1 x n )
称为二次型 。
定义 4.5.2 :若二次型中只含平方项,即
f ( x ) = k 1 x 1 2 + k 2 x 2 2 + ⋯ + k n x n 2 f(x)=k_1x_1^2+k_2x_2^2+\cdots+k_nx_n^2 f ( x ) = k 1 x 1 2 + k 2 x 2 2 + ⋯ + k n x n 2
则称为二次型的标准型 (或法式 )。
若标准型的系数
k 1 , k 2 , ⋯ , k n k_1,k_2,\cdots,k_n k 1 , k 2 , ⋯ , k n 只在
0 , − 1 , 1 0,-1,1 0 , − 1 , 1 中取,则称为二次型的
规范型 。
当
a i j a_{ij} a ij 为复数时,称
f f f 为
复二次型 ;当
a i j a_{ij} a ij 为实数时,称
f f f 为
实二次型 。
利用矩阵,可以将二次型表示为
f = x T A x f=\mathbf {x^TAx} f = x T Ax
将对称矩阵
A \mathbf A A 称为
二次型 f f f 的矩阵 ,也将
f f f 称为
对称矩阵 A \mathbf A A 的二次型 ,对称矩阵
A \mathbf A A 的秩也叫做
二次型 f f f 的秩 。
定义 4.5.3 :设
A \mathbf A A 和
B \mathbf B B 是
n n n 阶矩阵,若有可逆矩阵
C \mathbf C C 使
B = C T A C \mathbf {B=C^TAC} B = C T AC ,则称矩阵
A \mathbf A A 与
B \mathbf B B 合同 。
不难证明:
若 A \mathbf A A 为对称矩阵,则 B \mathbf B B 也是对称矩阵;
R ( B ) = R ( A ) \mathrm R(\mathbf B)=\mathrm R(\mathbf A) R ( B ) = R ( A ) 。
显然对于给定二次型
f = ∑ i , j = 1 n a i j x i x j f=\sum\limits_{i,j=1}^na_{ij}x_ix_j f = i , j = 1 ∑ n a ij x i x j
总有正交变换
x = P y \mathbf {x=Py} x = Py 使
f f f 化为标准型
f = ∑ i = 1 n λ i x i 2 f=\sum\limits_{i=1}^n\lambda_ix_i^2 f = i = 1 ∑ n λ i x i 2
其中
λ 1 , λ 2 , ⋯ , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ 1 , λ 2 , ⋯ , λ n 使
f f f 的矩阵
A = ( a i j ) \mathbf A=(a_{ij}) A = ( a ij ) 的特征值。
4.6 正定二次型
定义 4.6.1 :设二次型
f ( x ) = x T A x f(\mathbf x)=\mathbf {x^TAx} f ( x ) = x T Ax ,如果对任何
x ≠ 0 \mathbf {x\neq0} x = 0 ,都有
f ( x ) > 0 f(\mathbf x)>0 f ( x ) > 0 (显然
f ( 0 ) = 0 f(\mathbf 0)=0 f ( 0 ) = 0 ),则称
f f f 为
正定二次型 ,并称
对称矩阵 A \mathbf A A 是正定的 ;如果对任何
x ≠ 0 \mathbf x\neq\mathbf 0 x = 0 都有
f ( x ) < 0 f(\mathbf x)<0 f ( x ) < 0 ,则称
f f f 为
负定二次型 ,并称
对称矩阵 A \mathbf A A 是负定的 。
不难发现
n n n 元二次型
f = x T A x f=\mathbf {x^TAx} f = x T Ax 为正定的充分必要条件是:它的标准型的
n n n 个系数全为正,即它的规范型的
n n n 个系数全为
1 1 1 。