矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵

一、线性变换

1.1 什么是线性变换

首先给出一个比较抽象的解释方式:
A 对于一个变换A,找两个向量,如果这个变换满足可加性与齐次性:
A ( α + β ) = A α + A β A(\alpha+\beta)=A\alpha+A\beta
A ( k α ) = k ( A α ) A(k\alpha)=k(A\alpha)
线 那么这个变换就是线性变换

1.2 从函数角度理解

1.2.1 首先复习下函数

函数客观的讲就是把x轴上的点映射到曲线上,以下是一个正弦函数:
在这里插入图片描述

1.2.2 线性函数

有的函数,比如y=x,是把x轴上的点映射到直线上,这种称之为线性函数:
在这里插入图片描述

1.3 从线性函数到线性变换

线性函数其实就是线性变换,为了看起来更像线性变换,这里换一种标记方法:

之前的y=x,可以认为是把 ( a , 0 ) (a,0) 映射到了 ( 0 , a ) (0,a) 点,这被称为线性变换T,记作:
在这里插入图片描述
矩阵的形式如下:
在这里插入图片描述
这里将 ( a , 0 ) (a,0) 替换为平面内所有的点 ( a , b ) (a,b) ,我们就可以对整个平面做变换,该线性变换记作:
在这里插入图片描述
写成矩阵的形式:
在这里插入图片描述
我们记:
在这里插入图片描述
这时可以得到一个更简便的记法(这种形式看起来更像线性方程 y = a x y=ax ):
在这里插入图片描述
我们已经假定 y , x \overrightarrow{y},\overrightarrow{x} 指代了平面上所有的点,所以干脆可以更简化为:

线性变换通过矩阵A来表示

而y=x不过是这个A的一个特殊情况

1.4 矩阵A与基

刚才的结论其实是不完整的,还缺少了一个信息:
y=x是基于直角坐标系的,通过这个转换:
在这里插入图片描述
得到的A也是基于直角坐标系的。
只是在线性变换中,我们不称之为直角坐标系,而是叫做标准正交基。
标准正交基是:
在这里插入图片描述
它们张成的线性空间如下:

在这里插入图片描述
这里,对前面的结论进行一个补充:

线性变换通过指定基下的矩阵A来表示

注意这个”指定基“,这说明基不一定固定为正交基,由此引出相似矩阵的概念。

二、相似矩阵

2.1 定义:

A , B A,B 都是n阶矩阵,若有n阶可逆矩阵 P P ,使:
在这里插入图片描述
则称 B B A A 的相似矩阵,或者说 A A B B 相似。

2.2 解释

在这里插入图片描述
那怎么得到不同基下的矩阵呢? 这里看下具体的变换细节。

2.2.1 细节

首先看一个图,下面给出关于图的解释:
在这里插入图片描述

  • 有两个基: V 1 : { i , j } V_1:\{\overrightarrow{i},\overrightarrow{j}\} { i , j } \{\overrightarrow{i'},\overrightarrow{j'}\}
  • V 1 V 2 V1\to V2 ,可以通过 P 1 P^{-1} 转换
  • V 2 V 1 V2\to V1 ,可以通过 P P 转换

整个转换的核心如下:

在这里插入图片描述
对上面的图进行解释:

  • v \overrightarrow{v'} V 2 V_2 的点
  • v \overrightarrow{v'} 通过 P P 变为 V 1 V_1 下的点,即 P v P\overrightarrow{v'}
  • V 1 V_1 下,通过矩阵 A A 完成线性变换,即 A P v AP\overrightarrow{v'}
  • 通过 P 1 P^{-1} 变回 V 2 V_2 下的点,即 P 1 A P v P^{-1}AP\overrightarrow{v'}

综上,我们可以有:
在这里插入图片描述
我们可以认为:
在这里插入图片描述
那么B和A互为相似矩阵。

这里还有一个细节: V 2 V 1 V_2\to V_1 的转换矩阵 P P 是什么?
首先看空间中的一个点,假设为 m m 点:
在这里插入图片描述
这时我们知道,不管有没有基,这个点都是客观存在的,然后给出其在 i , j \overrightarrow{i'},\overrightarrow{j'} 的坐标 v \overrightarrow{v'}
在这里插入图片描述
为了表示 v \overrightarrow{v'} i , j \overrightarrow{i'},\overrightarrow{j'} 下的坐标,我们写成这样:
在这里插入图片描述
如果我们知道了 i , j \overrightarrow{i'},\overrightarrow{j'} i , j \overrightarrow{i},\overrightarrow{j} 下的坐标:
在这里插入图片描述
那么有:
v = a i + j = a ( c i + d j ) + b ( e i + f j ) \overrightarrow{v'}=a\overrightarrow{i'}+\overrightarrow{j'}=a(c\overrightarrow{i}+d\overrightarrow{j})+b(e\overrightarrow{i}+f\overrightarrow{j})

此时,实际上m点的坐标,已经变到了 i , j \overrightarrow{i},\overrightarrow{j} 下的 v \overrightarrow{v}
在这里插入图片描述
继续推导:
在这里插入图片描述
所以P其实就是:
在这里插入图片描述
这里的 i , j \overrightarrow{i'},\overrightarrow{j'} 是在 i , j \overrightarrow{i},\overrightarrow{j} 下的坐标。

2.2.2 对角矩阵

为什么我们需要相似矩阵呢?
比如A这个矩阵:
在这里插入图片描述
可以这样分解:
在这里插入图片描述
其中:

在这里插入图片描述
B就是对角矩阵,看上去好看很多,相似变换其实就是坐标转换,转换到一个更方便计算的简单坐标系。

https://www.matongxue.com/madocs/491.html

2.3 相似的性质:

  1. 反身性: A A ( I 1 A I = A ) A\backsim A\quad(I^{-1}AI=A)
  2. 对称性: A B B A A\backsim B\rArr B\backsim A
    ( A B P 1 A P = B A = ( P 1 ) 1 B P 1 ) (A\backsim B\rArr P^{-1}AP=B\rArr A=(P^{-1})^{-1}BP^{-1})
  3. 传递性: A B , B C , A C A\backsim B,B\backsim C,\rArr A\backsim C
    P 1 1 A P 1 = B , P 2 1 B P 2 = C P_1^{-1}AP_1=B,P_2^{-1}BP_2=C
    P 2 1 P 1 1 A P 2 P 1 = C \therefore P_2^{-1}P_1^{-1}AP_2P_1=C
    ( P 1 P 2 ) 1 A ( P 1 P 2 ) = C \therefore (P_1P_2)^{-1}A(P_1P_2)=C
  4. 相似矩阵的秩相同

三、对角矩阵

3.1 矩阵可对角化

如果矩阵 A A 能与对角矩阵相似,则称 A A 可对角化
例子:
A = [ 1 1 2 2 ] , P = [ 1 1 2 1 ] A=\begin{bmatrix}1&1\\2&2\end{bmatrix},P=\begin{bmatrix}1&-1\\2&1\end{bmatrix} ,则有:
P 1 A P = [ 3 0 0 0 ] P^{-1}AP=\begin{bmatrix}3&0\\0&0\end{bmatrix}
即: A [ 3 0 0 0 ] A\backsim\begin{bmatrix}3&0\\0&0\end{bmatrix}
从而 A A 可对角化

3.2 可对角化的条件

3.2.1 定理1:n阶矩阵A可对角化的充分必要条件是A有n个线性无关的特征向量

证明:
必要性:
如果A可对角化,则存在可逆矩阵P,使得:
A = [ λ 1 0 0 0 0 λ 2 0 0 0 0 0 λ n ] A=\begin{bmatrix}\lambda_1&0&0&\dots&0\\0&\lambda_2&0&\dots&0\\\vdots&\dots&\dots&\ddots&\vdots\\0&0&0&\dots&\lambda_n\end{bmatrix}

将P按列分块得到 P = [ X 1 , X 2 , . . . , X n ] P=[X_1,X_2,...,X_n] ,从而有:

A P = A [ X 1 , X 2 , . . . , X n ] = P [ λ 1 0 0 0 λ 2 0 0 0 λ n ] = [ X 1 , X 2 , . . . , X n ] [ λ 1 0 0 0 λ 2 0 0 0 λ n ] AP=A[X_1,X_2,...,X_n]=P\begin{bmatrix}\lambda_1&0&\dots&0\\0&\lambda_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&\lambda_n\end{bmatrix}=[X_1,X_2,...,X_n]\begin{bmatrix}\lambda_1&0&\dots&0\\0&\lambda_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&\lambda_n\end{bmatrix}
因此有:
A X i = λ i X i ( i = 1 , 2 , . . . , n ) AX_i=\lambda_iX_i\quad(i=1,2,...,n) ,所以 X i X_i 是A的属于特征值 λ i \lambda_i 的特征向量,又由P可逆,知 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n 线性无关,故A有n个线性无关的特征向量。

3.2.2 定理2:矩阵A的属于不同特征值的特征向量是线性无关的
3.2.3 推论1:若n阶矩阵有n个互不相同的特征值 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n ,则A可对角化,且:

在这里插入图片描述

3.2.4 定理三

在这里插入图片描述

https://wenku.baidu.com/view/58dcd9d376eeaeaad1f33024.html

3.3 对角矩阵的性质

3.3.1 对角矩阵的秩等于其对角线上非零元素的个数。

四、可逆矩阵

4.1 定义

设A为n阶方阵,若存在n阶方阵B,使得:
A B = B A = I AB=BA=I
则称A为可逆矩阵,B为A的逆矩阵,记为 A 1 = B A^{-1}=B

单位矩阵I:
I 1 = I I^{-1}=I
( k I ) 1 = 1 k I , ( k 0 ) (kI)^{-1}={1\over k}I,(k\ne0)

对角矩阵:

D= [ d 1 0 0 0 d 2 0 0 0 d n ] , ( d 1 , d 2 , . . . d n 0 ) ; D 1 = [ 1 d 1 0 0 0 1 d 2 0 0 0 1 d n ] \begin{bmatrix}d_1&0&\dots&0\\0&d_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&d_n\end{bmatrix},(d_1,d_2,...d_n\ne0);\quad D^{-1}=\begin{bmatrix}{1\over d_1}&0&\dots&0\\0&{1\over d_2}&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&{1\over d_n}\end{bmatrix}

4.2 定理

4.2.1 定理1:设A可逆,则它的逆是唯一的

证明:
设有B和C满足:AB=BA=I,AC=CA=I
则:B=BI=B(AC)=(BA)C=IC=C

4.2.2 定理2:设A为n阶矩阵,则下列命题等价:
  1. A是可逆的
  2. AX=0只有零解
    1 2 A X A X = 0 1\to2:设A是可逆的,且X是AX=0的解,则:
    X = I X = ( A 1 A ) X = A 1 ( A X ) = A 1 0 = 0 X=IX=(A^{-1}A)X=A^{-1}(AX)=A^{-1}0=0
    所以,AX=0只有零解
  3. A与I行等价
    2 3 A B 2\to3:A经过初等行变换到B(行阶梯矩阵)
    B X = 0 B B B X = 0 BX=0只有零解,B的对角元均非零,否则B的最后一行的元全为零,则BX=0有非零解(矛盾)
    B = I 则,B经初等行变换后得到的行最简化矩阵=I
  4. A可表为有限个初等矩阵的乘积
    3 4 3 A I E 1 , E 2 , . . . E k 使 E k , . . . E 1 A = I 3\to4:由3,可得A可经初等行变换得到I,所以存在初等矩阵E_1,E_2,...E_k,使得E_k,...E_1A=I
    A = E 1 1 . . . . E k 1 I = E 1 1 . . . E k 1 A=E_1^{-1}....E_k^{-1}I=E_1^{-1}...E_k^{-1}
4.2.3 推论:设A为n阶矩阵,则AX=b有唯一解的充要条件是A可逆

证明:
充分性:
A X = b X = A 1 b AX=b有唯一解:X=A^{-1}b
必要性:
A X = b X A 设AX=b有唯一解X,但A不可逆
A A X = 0 Z A不可逆\rArr AX=0有非零解Z
Y = X + Z 令Y=X+Z
A Y = A ( X + Z ) = A X + A Z = b + 0 = b AY=A(X+Z)=AX+AZ=b+0=b
Y A X = b 则Y为AX=b的解,矛盾
所以可得A可逆

4.3 性质

设A,B皆为n阶可逆矩阵,数 λ 0 \lambda\ne0 ,则:

  1. A 1 A^{-1} 可逆,且 ( A 1 ) 1 = A (A^{-1})^{-1}=A
  2. λ A \lambda A 可逆,且 ( λ A ) 1 = 1 λ A 1 (\lambda A)^{-1}={1\over\lambda}A^{-1}
  3. A B AB 可逆,且 ( A B ) 1 = B 1 A 1 (AB)^{-1}=B^{-1}A^{-1}
    ( A B ) ( B 1 A 1 ) = A ( B B 1 ) A 1 = A A 1 = I (AB)(B^{-1}A^{-1})=A(BB^{-1})A^{-1}=AA^{-1}=I
  4. A T A^T 可逆,且 ( A T ) 1 = ( A 1 ) T (A^T)^{-1}=(A^{-1})^T
    A T ( A 1 ) T = ( A 1 A ) T = I A^T(A^{-1})^T=(A^{-1}A)^T=I
  5. 逆矩阵行列式和原矩阵行列式的关系
    在这里插入图片描述

https://wenku.baidu.com/view/84eda27b27284b73f24250ce.html?sxts=1591611918853

五、过渡矩阵

过渡矩阵是基与基之间的一个可逆线性变换,在一个空间V下可能存在不同的基。假设有两组基分别为A,B。由基A到基B可以表示为B=AP,过渡矩阵 P = A 1 B P=A^{-1}B ,它表示的是基与基之间的关系。

猜你喜欢

转载自blog.csdn.net/kking_edc/article/details/106571891