高等代数笔记5：线性变换

线性映射的定义与性质

线性映射的定义

数学研究的主题是空间与变换，对于代数学而言，空间指的是赋予了某种运算结构的集合，变换则是空间到空间的映射。线性代数则是研究线性空间及其上的映射。但是，研究的对象不是所有的映射，而是特殊的一类映射，这类映射和线性运算紧密联系，称为线性映射。

定义5.1 $V_1,V_2$ 是 $K$ 的两个线性空间， $f:V_1\to V_2$ 是 $V_1$ 到 $V_2$ 的映射，如果满足：
$\forall k_1,k_2\in K,\forall x_1,x_2\in V_1$ 都有
$f(k_1x_1+k_2x_2)=k_1f(x_1)+k_2f(x_2)$ 则称 $f$ 是 $V_1$ 到 $V_2$ (定义在 $V_1$ ，取值于 $V_2$ )的线性映射

在线性代数中，我们称这类映射为线性映射，在泛函分析中，我们称这类映射为线性算子。

定义5.2 $V$ 是 $K$ 的线性空间， $V$ 到 $V$ 的线性映射称为 $V$ 上的线性变换

线性变换就是线性空间自己到自己的线性映射，是一类特殊的线性映射。当然，线性映射的例子相当多，就前面的矩阵代数而言
$y=Ax$ 就是就是 $K^n$ 到 $K^m$ 的线性映射，平面解析几何和空间解析几何中的伸缩、旋转都是线性映射。另外， $K$ 也是 $K$ 上的线性空间， $V$ 到 $K$ 的线性映射是一个函数，称为线性函数，在泛函分析中称为线性泛函。在有限维线性空间的情形下，要把握一个线性映射其实相当简单。设 $V_1$ 是 $n$ 维线性空间， $e_1,\cdots,e_n$ 是 $V_1$ 的一组基， $V_2$ 是 $m$ 维线性空间， $\varepsilon_1,\cdots,\varepsilon_m$ 是 $V_2$ 的一组基。对任意的 $x\in V_1$ ， $x$ 可唯一表为
$x=k_1e_1+\cdots+k_ne_n$ 对任意的线性映射 $f:V_1\to V_2$ ，就有
$f(x)=k_1f(e_1)+\cdots+k_nf(e_n)$ 也就是说，要把握 $f$ 的象，只需要把握 $f(e_1),\cdots,f(e_n)$ 即可。只要把握了基的象，全空间的象戳手可得，这是线性映射相对于其他映射的良好性质。对于一个映射，我们还关心映射是否是单射，又是否是满射。下面我们来给出判断线性映射是单射还是满射的条件。

线性映射的单射与线性空间的同构

定理5.1 $V_1,V_2$ 是 $K$ 上的线性空间， $f:V_1\to V_2$ 是线性映射，则 $f$ 是单射的充要条件是 $0$ 的原象只能是 $0$

证：
必要性是显然的，仅证充分性，如果 $f^{-1}(0)={0}$ ，则若 $f(x_1)=f(x_2)$ ，就有 $f(x_1-x_2)=0$ ，可以推出
$x_1-x_2=0$ 因此 $f$ 是单射

我们注意到，线性映射是否是单射，只与 $0$ 的原象有关系，我们定义
$\ker(f) = \{x\in V_1:f(x)=0\}$ 容易验证 $\ker(f)$ 是 $V_1$ 的子空间，如果 $\ker(f)=\{0\}$ ，那么 $f$ 是单射，否则不是单射。 $\ker(f)$ 又称为 $f$ 的核空间或零空间。我们知道，把握 $f(e_1),\cdots,f(e_n)$ 就可以把握线性映射的像，因此，又可以从 $f(e_1),\cdots,f(e_n)$ 的线性相关性和线性无关性给出判断单射的条件。

定理5.2 $V_1,V_2$ 是 $K$ 上的线性空间， $f:V_1\to V_2$ 是线性映射， $e_1,\cdots,e_n$ 是 $V_1$ 的一组基，则 $f$ 是单射的充分必要条件是 $f(e_1),\cdots,f(e_n)$ 线性无关

证：
充分性，如果 $f(e_1),\cdots,f(e_n)$ 线性无关，对任意的 $x=x_1e_1+\cdots+x_ne_n$ ，若满足 $f(x)=0$ ，则
$x_1f(e_1)+x_2f(e_2)+\cdots+x_nf(e_n)=0$ 由 $f(e_1),\cdots,f(e_n)$ 线性无关，可以推出 $x_1=x_2=\cdots=x_n=0$ ， $x=0$ ，因此， $f$ 是单射
必要性，如果 $f$ 是单射，而 $f(e_1),\cdots,f(e_n)$ 线性相关，存在不全为0的 $k_1,\cdots,k_n$ ，使得
$k_1f(e_1)+\cdots+k_nf(e_n)=f(k_1e_1+\cdots+k_ne_n)=0$ 令 $x=k_1e_1+\cdots+k_ne_n$ ， $x\neq 0$ ， $\ker(f)\neq \{0\}$ ， $f$ 不是单射，矛盾，因此， $f(e_1),\cdots,f(e_n)$ 线性无关

如果线性映射 $f$ 即是单射，又是满射，那么 $f$ 的逆映射存在。并且，容易验证： $f^{-1}$ 也是线性映射。设 $V_1$ 的一组基为 $e_1,\cdots,e_n$ ，由于 $f$ 是单射，这样，就可以得出结论： $f(e_1),\cdots,f(e_n)$ 线性无关，但 $f$ 又是满射，任意 $y\in V_2$ 都可以找到原象，从而可以得出结论： $f(e_1),\cdots,f(e_n)$ 是 $V_2$ 的一组基， $f$ 在两组基之间搭起一个桥梁，这样，我们可以视 $V_1,V_2$ 为同一个线性空间，只不过，在 $V_1$ 上，基表现为 $e_1,\cdots,e_n$ ，在 $V_2$ 上，基表现 $f(e_1),\cdots,f(e_n)$ ，两个线性空间除了元素的形式不同外，没有其他本质的差别，就称 $V_1,V_2$ 同构。

定义5.3 $V_1,V_2$ 是 $K$ 上的两个线性空间，如果存在 $V_1$ 到 $V_2$ 的线性映射 $f$ ， $f$ 既是单射，又是满射，则称 $f$ 是 $V_1$ 到 $V_2$ 的同构映射， $V_1$ 和 $V_2$ 同构

通过前面论述又不难有以下结论：

命题5.1 $V_1,V_2$ 是 $K$ 上的两个有限维线性空间， $V_1,V_2$ 同构的充分必要条件为 $\dim(V_1)=\dim(V_2)$

证：
必要性前面已经证明，仅证充分性：
设 $\dim(V_1)=\dim(V_2)$ ，要证明 $V_1,V_2$ 同构，就要构造 $V_1$ 到 $V_2$ 的一个同构映射，设 $e_1,\cdots,e_n$ 是 $V_1$ 的一组基， $\varepsilon_1,\cdots,\varepsilon_n$ 是 $V_2$ 的一组基，构造映射 $f:V_1\to V_2$ ：
$f(k_1e_1+\cdots+k_ne_n)=k_1\varepsilon_1+\cdots+k_n\varepsilon_n$ 则 $f(e_i)=\varepsilon_i,i=1,\cdots,n$ ，并且 $f$ 是线性映射，并且由构造容易知道 $f$ 既是单射，又是满射。

于是，任意 $K$ 上的 $n$ 维线性空间，都与 $K^n$ 同构，从某种意义上来看，虽然抽象的线性空间十分抽象，不好把握，但是，其实质就是 $n$ 维向量空间。

线性映射的运算的空间

线性映射也可以作为集合的元素构成线性空间。我们记 $V_1\to V_2$ 的全体线性映射为 $M(V_1,V_2)$ ，记 $V$ 上的线性变换为 $M(V)$ 。 $f_1,f_2\in M(V_1,V_2)$ ，定义 $f_1+f_2:V_1\to V_2$ ，对任意的 $x\in V_1$ ：
$(f_1+f_2)(x)=f_1(x)+f_2(x)$ 对任意的 $k\in K$ ，定义 $kf:V_1\to V_2$ ，对任意的 $x\in V_1$ ：
$(kf)(x)=kf(x)$ 只需要验证其满足线性空间的八条运算性质即可：
(1) $(f_1+f_2)(x)=f_1(x)+f_2(x)=f_2(x)+f_1(x)=(f_2+f_1)(x),\forall x\in V_1$
(2) $(f_1+f_2+f_3)(x)=f_1(x)+f_2(x)+f_3(x)=f_1(x)+(f_2(x)+f_3(x))=(f_1+(f_2+f_3))(x)$
(3) $0:V_1\to V_2$ 定义成任意元素都映射为0， $0+f=f$
(4) $\forall f \in M(V_1,V_2),-f = (-1).f$
其他四条验证是类似的， $M(V_1,V_2)$ 构成一个线性空间，自然地， $M(V)$ 也是一个线性空间。

$M(V)$ 有着一般线性空间没有的运算就是运算的复合，就是运算的乘法。 $\forall f_1,f_2\in M(V)$ ， $f_1f_2$ 定义为 $\forall x \in V$ ， $(f_1f_2)(x)=f_1(f_2(x))$ ，容易验证 $f_1f_2$ 还是 $V$ 上的线性变换，这样， $M(V)$ 上可以定义出多项式。这里我们不再做详细的论述。

线性映射与矩阵

下面我们讨论线性映射和矩阵的关系。假设 $f$ 是 $V_1$ 到 $V_2$ 的线性映射，其中， $V_1$ 和 $V_2$ 都是 $K$ 上的有限维线性空间， $\dim(V_1)=n$ ， $\dim(V_2)=m$ ，设 $e_1,\cdots,e_n$ 是 $V_1$ 的一组基， $b_1,\cdots,b_m$ 是 $V_2$ 的一组基。则
$\begin{cases} f(e_1)=a_{11}b_1+\cdots+a_{1m}b_m\\ f(e_2)=a_{21}b_1+\cdots+a_{2m}b_m\\ \cdots\\ f(e_n)=a_{n1}b_1+\cdots+a_{nm}b_m \end{cases}$ 可以看到，以上方程式就类似于线性方程组，我们也写成形式矩阵乘法的形式：
$f(e_1,\cdots,e_n)=(b_1,\cdots,b_m)A$ 其中矩阵
$A=\left[ \begin{matrix} a_{11}&a_{21}&\cdots&a_{n1}\\ a_{12}&a_{22}&\cdots&a_{n2}\\ \cdots\\ a_{1m}&a_{2m}&\cdots&a_{nm} \end{matrix}\right]$ 当然也可以写成转置的形式，这里不再赘述。 $A$ 就称为 $f$ 在基 $e_1,\cdots,e_n$ 到 $b_1,\cdots,b_m$ 下的矩阵。如果 $f$ 是 $V$ 上的线性变换， $\dim(V)=n<\infty$ ，任取 $e_1,\cdots,e_n$ 为 $V$ 的一组基，则
$\begin{cases} f(e_1)=a_{11}e_1+a_{12}e_2+\cdots+a_{1n}e_n\\ f(e_2)=a_{21}e_1+a_{22}e_2+\cdots+a_{2n}e_n\\ \cdots\\ f(e_n)=a_{n1}e_1+a_{n2}e_2+\cdots+a_{nn}e_n \end{cases}$ 写成形式矩阵的形式即为
$f(e_1,\cdots,e_n)=(e_1,\cdots,e_n)A$
其中
$A=\left[\begin{matrix} a_{11}&a_{21}&\cdots&a_{n1}\\ a_{12}&a_{22}&\cdots&a_{n2}\\ \cdots\\ a_{1n}&a_{2n}&\cdots&a_{nn} \end{matrix}\right]$ $A$ 就称为线性变换 $f$ 在 $e_1,\cdots,e_n$ 下的矩阵。对线性映射，我们需要两组基确定一个矩阵，但对线性变换，只需要一组基就可以确定一个矩阵。对线性映射 $f:V_1\to V_2$ ，对于确定的两组基，就可以确定一个唯一的矩阵，反过来，给定两组基，给定一个矩阵，可以构造出一个线性映射，对于线性变换亦是如此，这就说明，线性映射空间 $M(V_1,V_2)$ 和相应的矩阵空间是一一对应的，并且还是线性同构的，容易验证： $\alpha_1f_1+\alpha_2f_2$ 在两组基下的矩阵等于各自在这两组基下矩阵的线性组合，说明 $M(V_1,V_2)$ 到矩阵空间的这一一对一映射还是线性映射。为了说明这点，我们简单验证一点性质即可
$f,g$ 是 $V_1$ 到 $V_2$ 的线性映射， $e_1,\cdots,e_n$ 是 $V_1$ 的一组基， $\varepsilon_1,\cdots,\varepsilon_m$ 是 $V_2$ 的一组基， $f$ 在 $e_1,\cdots,e_n$ 到 $\varepsilon_1,\cdots,\varepsilon_m$ 的矩阵是 $A$ ，而 $g$ 在两组基下的矩阵是 $B$ ,则 $\alpha f+\beta g$ 在这两组基下的矩阵为 $\alpha A+\beta B$ 。
假设 $A=(a_{ij}),B=(b_{ij})$ ，则
$f(e_j)=\sum_{i=1}^m{a_{ij}\varepsilon_i}\quad j=1,\cdots,n$ 同样地
$g(e_j)=\sum_{i=1}^m{b_{ij}\varepsilon_i}\quad j=1,\cdots,n$ 于是，就有
$(\alpha f+\beta g)(e_j)= \sum_{i=1}^m{(\alpha a_{ij}+\beta b_{ij})\varepsilon_i}\quad j=1,\cdots,n$ 这就验证了 $\alpha f+\beta g$ 在两组基下的矩阵为 $\alpha A+\beta B$ 。同样地， $M(V)$ 和 $M_n(K)$ 是线性同构的。据此，我们可以提出如下的观点，在线性代数领域：
矩阵是线性映射的矩阵

矩阵和线性映射的关系可以总结为：
(1)矩阵是线性映射的矩阵，是线性映射的具体表现
(2)矩阵为线性映射的相关计算提供了手段
不仅如此，还容易验证，线性映射复合的矩阵就等于矩阵的乘法。这样，我们就把抽象的线性空间上的线性映射和具体的矩阵联系在了一起。矩阵运算都有了相应的意义。

接下来的一个问题是：对于同一个线性变换 $f\in M(V)$ ，其中， $\dim(V)=n$ ，选择不同的基，线性变换的在不同基下的矩阵有何关系呢？在引出线性映射的矩阵时，我们给出了一种形式矩阵的运算。我们先给出形式矩阵运算的一个基本性质。
$e_1,\cdots,e_n$ 是 $V$ 的一个向量组， $A$ 是一个 $n$ 阶矩阵， $B$ 也是一个 $n$ 阶矩阵，则
$[(e_1,\cdots,e_n)A]B=(e_1,\cdots,e_n)(AB)$ 其中 $A$ 是 $n\times m$ 矩阵， $B$ 是 $m\times k$ 矩阵，只需要作简单的验证即可。设 $A=(a_{ij}),B=(b_{ij})$ ，则\
令 $(\beta_1,\cdots,\beta_m)=(e_1,\cdots,e_n)A$ ，则
$\beta_i=\sum_{j=1}^n{a_{ij}e_j}\quad i=1,\cdots,m$ 再设 $(\gamma_1,\cdots,\gamma_k)=(\beta_1,\cdots,\beta_m)B$ ，于是
$\gamma_i=\sum_{s=1}^m{b_{si}\beta_s}= \sum_{s=1}^mb_{si}(\sum_{j=1}^na_{js}e_j) =\sum_{j=1}^n\sum_{s=1}^m{(a_{js}b_{si})e_j}$ 其中 $i=1,\cdots,k$ ，这就验证了
$(\gamma_1,\cdots,\gamma_k)=(e_1,\cdots,e_n)(AB)$ 假设线性变换 $f$ 在基 $e_1,\cdots,e_n$ 下的矩阵为 $A$ ，就有
$(f(e_1),\cdots,f(e_n))=(e_1,\cdots,e_n)A$ 再假设 $\beta_1,\cdots,\beta_n$ 是 $V$ 的另一组基，设
$(\beta_1,\cdots,\beta_n)P=(e_1,\cdots,e_n)$ 同时
$(\beta_1,\cdots,\beta_n)=(e_1,\cdots,e_n)Q$ 于是
$(e_1,\cdots,e_n)(PQ)=(e_1,\cdots,e_n)$ 由于 $e_1,\cdots,e_n$ 是 $V$ 的一组基，并且坐标具有唯一性，就有
$QP=I_n$ 因此 $P$ 可逆，并且有
$f(e_1,\cdots,e_n)=f(\beta_1,\cdots,\beta_n)P =(e_1,\cdots,e_n)A=(\beta_1,\cdots,\beta_n)(PA)$ 两边同右乘 $P^{-1}$ ，就有
$f(\beta_1,\cdots,\beta_n)=(\beta_1,\cdots,\beta_n)(PAP^{-1})$ 实际上， $P$ 是 $(\beta_1,\cdots,\beta_n)$ 到 $(e_1,\cdots,e_n)$ 的过渡矩阵，或称基变换矩阵， $P^{-1}$ 是\ $(e_1,\cdots,e_n)$ 到 $(\beta_1,\cdots,\beta_n)$ 的过渡矩阵。 $f$ 在 $\beta_1,\cdots,\beta_n$ 下的矩阵为
$B=PAP^{-1}$ 下面我们定义 $n$ 阶方阵的相似关系：

定义5.4 $A,B$ 是数域 $K$ 下的 $n$ 阶方阵，如果存在 $n$ 阶可逆方阵 $P$ ，使得 $B=PAP^{-1}$ 则称 $A$ 和 $B$ 是相似矩阵

由上面的论述，同一线性变换在不同基下的矩阵是相似关系。并且容易验证：相似关系满足自反性，对称性和传递性，是一个等价关系，这样，我们就可以利用相似关系将 $n$ 阶矩阵划分成若干个等价类。在同一等价类内，不同矩阵对应不同的一组基，自然地，我们就像寻找等价类内一组"最好"的基，使得 $f$ 在这组基下的矩阵"最简单"，最好简单到对角矩阵。这就是特征值和特征向量要研究的问题。

线性变换的特征值与特征向量

特征值问题的引入

前面我们讲过，线性变换在不同基下的矩阵是相似的关系，这就启发我们去寻找一组"最好"的基，使线性变换在这组基下的矩阵"最简单"，最简单的矩阵莫过于对角矩阵。即
$f(e_1,\cdots,e_n)=(e_1,\cdots,e_n)D$ $(e_1,\cdots,e_n)$ 是 $V$ 的一组基， $D=diag(\lambda_1,\cdots,\lambda_n)$ 。于是
$f(e_i)=\lambda_i e_i \quad i=1,\cdots,n$ 线性变换 $f$ 只是将 $e_i$ 进行了伸缩变换，对任意的 $x=a_1e_1+\cdots+a_ne_n$ ，于是
$f(x)=\sum_{i=1}^n{a_i\lambda_i e_i}$ 我们发现，在这组基下，线性变换变得"异常简单"。接下来线性代数的中心问题，就是寻找一组基，矩阵"最简单"，本章讲述矩阵是对角阵的情形，在最后两章，我们讲述不能对角化的情况下，最简单的矩阵，即"约当标准型"。

定义5.5 $V$ 是 $K$ 上的 $n$ 维线性空间， $f$ 是 $V$ 上的线性变换，如果存在 $\lambda\in K$ 及非零向量 $e\in V$ ，满足：
$f(e)=\lambda e$ 则称 $\lambda$ 是 $f$ 的特征值， $e$ 是 $\lambda$ 对应的特征向量

如果有 $n$ 个线性无关的特征向量，那么自然就可以对角化，否则就不能对角化。那么，怎么寻找 $n$ 个线性无关的特征向量呢？我们先任取一组基 $(e_1,\cdots,e_n)$ ，设 $f$ 在这组基下的矩阵为 $A=(a_{ij})$ ，设 $x=x_1e_1+\cdots+x_ne_n$ 是 $\lambda$ 的特征向量。则
$f(x) =(e_1,\cdots,e_n)A(x_1,\cdots,x_n)^T=(e_1,\cdots,e_n)\lambda(x_1,\cdots,x_n)^T$ 于是得到方程组
$Ax=\lambda x$ 这里的 $x$ 是 $n$ 维列向量 $(x_1,\cdots,x_n)^T$ ，这个方程组由非零解等价于行列式
$\det(A-\lambda I_n)=0$ 而这个行列式是关于 $\lambda$ 的 $n$ 次多项式，并且，并且，如果 $B$ 和 $A$ 相似，存在可逆矩阵 $P$ ，使得 $B=PAP^{-1}$ ，由行列式的性质，就有
$\det(B-I_n)=\det(P(A-\lambda I_n)P^{-1})=\det(A-\lambda I_n)$ 可见特征多项式和基的选取无关，因而，特征多项式既可以称为是线性变换的特征多项式，又可以称为是矩阵的特征多项式。特征值既可以称为是线性变换的特征值，又可以称为是矩阵的特征值。并且方程组 $(A-\lambda I_n)x=0$ 求解出来的 $n$ 维向量是特征向量对应的坐标，这样我们就得到了特征向量和特征值的计算方法。下面我们引入特征空间的概念，对于 $\lambda\in K$ ，称
$V_{\lambda}=\{x:f(x)=\lambda x\}$ 为 $\lambda$ 对应的特征空间，容易验证特征空间是子空间，如果 $\lambda$ 不是特征值，特征空间是零空间，如果是特征值，特征空间非零，就有重数，称为 $\lambda$ 的几何重数。

可对角化的充要条件

什么情况下 $f$ 可对角化呢，很显然

定理5.4 $f$ 是 $K$ 上 $n$ 维线性空间 $V$ 上的线性变换， $f$ 可对角化的充要条件是存在 $n$ 个线性无关的特征向量。

假设线性变换的特征多项式为 $h(\lambda)$ ，由于 $h$ 是 $n$ 次多项式，由代数基本定理， $h$ 有 $n$ 个复根。特征值与否当然要看数域，在复数域上一定有 $n$ 个特征值(含重根)，更小的数域则不一定。实线性空间上的线性变换的就不一定有 $n$ 个特征值。

命题5.2 $f$ 是 $K$ 上 $n$ 维线性空间 $V$ 上的线性变换， $e_1,\cdots,e_s$ 是 $f$ 对应不同特征值的特征向量，则 $e_1,\cdots,e_s$ 线性无关

证：
设 $e_1,\cdots,e_s$ 对应的特征值为 $\lambda_1,\cdots,\lambda_s$ 。设 $x_1e_1+\cdots+x_se_s=0$ 两边用 $f$ 作用
$x_1\lambda_1e_1+\cdots+x_s\lambda_se_s=0$ 用数学归纳法对 $s$ 进行归纳， $s=1$ 时，结论显然成立。
假设 $s=k$ 时结论成立， $s=k+1$ 时，第一个向量等式两边乘以 $\lambda_1$ ，两个向量等式相减，就可以证得结论。
由数学归纳法，结论成立。

推论5.1 $f$ 是 $K$ 上 $n$ 维线性空间 $V$ 上的线性变换， $e_1,\cdots,e_s$ 是 $s$ 个不同的数 $\lambda_1,\cdots,\lambda_s$ 特征空间中的向量，如果
$e_1+e_2+\cdots+e_s=0$ 则 $e_1=\cdots=e_s=0$

证：
如果 $e_1,\cdots,e_s$ 不全为0，那么，至少有两个向量不为0。
不妨设至少 $e_1,e_2$ 全不为0，两边用 $f$ 作用，有
$\lambda_1e_1+\cdots+\lambda_se_s=0$ 而 $\lambda_1,\lambda_2$ 不全为0，与 $e_1,\cdots,e_s$ 中非零向量线性无关矛盾。

命题5.3 $f$ 是 $K$ 上 $n$ 维线性空间 $V$ 上的线性变换， $\lambda_1,\cdots,\lambda_s$ 是 $f$ 的 $s$ 个全部不同的特征值，则 $f$ 可对角化的充要条件是各特征值几何重数的和为 $n$

证：
$\lambda_i(i=1,\cdots,s)$ 特征子空间的一组基 $e_{ij},j=1,\cdots,n_i$ ，令
$\sum_{i=1}^s\sum_{j=1}^{n_i}{k_{ij}e_{ij}}=0$ 与上面的推论，有
$\sum_{j=1}^{n_i}{k_{ij}e_{ij}}=0,i=1,\cdots,s$ 于是 $k_{ij}=0,i=1,\cdots,s,j=1,\cdots,n_i$ ，于是 $f$ 可对角化

我们已经指出，全部特征值由特征多项式 $\det(A-\lambda I_n)=0$ 计算得到。特征根在多项式中的重数称为代数重数。

命题5.4 $f$ 是 $K$ 上 $n$ 维线性空间 $V$ 上的线性变换， $\lambda_0$ 是 $f$ 的特征值，则其几何重数不超过其代数重数

证：
设 $\lambda_0$ 的特征空间的几何重数为 $r$ ，设其中一组基为 $e_1,\cdots,e_r$ ，将其扩张为 $V$ 的一组基 $e_1,\cdots,e_n$ ，则 $f$ 在这组基下的矩阵为
$\left[\begin{matrix} \lambda_0 I_r&A\\ 0&B\\ \end{matrix}\right]$ 于是，由分块矩阵行列式计算性质， $f$ 的特征多项式为
$(\lambda_0-\lambda)^r\det(B-\lambda I_{n-r})=0$ 而 $\lambda_0$ 还可能是 $\det(B-\lambda I_{n-r})=0$ 的根

这说明了， $f$ 可对角化，要满足两点：
(1) $f$ 的特征多项式的根都在数域 $K$ 内
(2) $f$ 的所有特征值的代数重数都等于几何重数
同时，每个特征值的特征空间的维度至少为1，因此，就有如下的命题：

命题5.5 $f$ 是 $K$ 上 $n$ 维线性空间 $V$ 上的线性变换，如果 $f$ 有 $n$ 个不同的特征值，则 $f$ 可对角化

p_wh

发布了19 篇原创文章 · 获赞 0 · 访问量 740

私信关注