线性映射的定义与性质
线性映射的定义
数学研究的主题是空间与变换,对于代数学而言,空间指的是赋予了某种运算结构的集合,变换则是空间到空间的映射。线性代数则是研究线性空间及其上的映射。但是,研究的对象不是所有的映射,而是特殊的一类映射,这类映射和线性运算紧密联系,称为线性映射。
定义5.1
V1,V2是
K的两个线性空间,
f:V1→V2是
V1到
V2的映射,如果满足:
∀k1,k2∈K,∀x1,x2∈V1都有
f(k1x1+k2x2)=k1f(x1)+k2f(x2)则称
f是
V1到
V2(定义在
V1,取值于
V2)的线性映射
在线性代数中,我们称这类映射为线性映射,在泛函分析中,我们称这类映射为线性算子。
定义5.2
V是
K的线性空间,
V到
V的线性映射称为
V上的线性变换
线性变换就是线性空间自己到自己的线性映射,是一类特殊的线性映射。当然,线性映射的例子相当多,就前面的矩阵代数而言
y=Ax就是就是
Kn到
Km的线性映射,平面解析几何和空间解析几何中的伸缩、旋转都是线性映射。另外,
K也是
K上的线性空间,
V到
K的线性映射是一个函数,称为线性函数,在泛函分析中称为线性泛函。在有限维线性空间的情形下,要把握一个线性映射其实相当简单。设
V1是
n维线性空间,
e1,⋯,en是
V1的一组基,
V2是
m维线性空间,
ε1,⋯,εm是
V2的一组基。对任意的
x∈V1,
x可唯一表为
x=k1e1+⋯+knen对任意的线性映射
f:V1→V2,就有
f(x)=k1f(e1)+⋯+knf(en)也就是说,要把握
f的象,只需要把握
f(e1),⋯,f(en)即可。只要把握了基的象,全空间的象戳手可得,这是线性映射相对于其他映射的良好性质。对于一个映射,我们还关心映射是否是单射,又是否是满射。下面我们来给出判断线性映射是单射还是满射的条件。
线性映射的单射与线性空间的同构
定理5.1
V1,V2是
K上的线性空间,
f:V1→V2是线性映射,则
f是单射的充要条件是
0的原象只能是
0
证:
必要性是显然的,仅证充分性,如果
f−1(0)=0,则若
f(x1)=f(x2),就有
f(x1−x2)=0,可以推出
x1−x2=0因此
f是单射
我们注意到,线性映射是否是单射,只与
0的原象有关系,我们定义
ker(f)={x∈V1:f(x)=0}容易验证
ker(f)是
V1的子空间,如果
ker(f)={0},那么
f是单射,否则不是单射。
ker(f)又称为
f的核空间或零空间。我们知道,把握
f(e1),⋯,f(en)就可以把握线性映射的像,因此,又可以从
f(e1),⋯,f(en)的线性相关性和线性无关性给出判断单射的条件。
定理5.2
V1,V2是
K上的线性空间,
f:V1→V2是线性映射,
e1,⋯,en是
V1的一组基,则
f是单射的充分必要条件是
f(e1),⋯,f(en)线性无关
证:
充分性,如果
f(e1),⋯,f(en)线性无关,对任意的
x=x1e1+⋯+xnen,若满足
f(x)=0,则
x1f(e1)+x2f(e2)+⋯+xnf(en)=0由
f(e1),⋯,f(en)线性无关,可以推出
x1=x2=⋯=xn=0,
x=0,因此,
f是单射
必要性,如果
f是单射,而
f(e1),⋯,f(en)线性相关,存在不全为0的
k1,⋯,kn,使得
k1f(e1)+⋯+knf(en)=f(k1e1+⋯+knen)=0令
x=k1e1+⋯+knen,
x=0,
ker(f)={0},
f不是单射,矛盾,因此,
f(e1),⋯,f(en)线性无关
如果线性映射
f即是单射,又是满射,那么
f的逆映射存在。并且,容易验证:
f−1也是线性映射。设
V1的一组基为
e1,⋯,en,由于
f是单射,这样,就可以得出结论:
f(e1),⋯,f(en)线性无关,但
f又是满射,任意
y∈V2都可以找到原象,从而可以得出结论:
f(e1),⋯,f(en)是
V2的一组基,
f在两组基之间搭起一个桥梁,这样,我们可以视
V1,V2为同一个线性空间,只不过,在
V1上,基表现为
e1,⋯,en,在
V2上,基表现
f(e1),⋯,f(en),两个线性空间除了元素的形式不同外,没有其他本质的差别,就称
V1,V2同构。
定义5.3
V1,V2是
K上的两个线性空间,如果存在
V1到
V2的线性映射
f,
f既是单射,又是满射,则称
f是
V1到
V2的同构映射,
V1和
V2同构
通过前面论述又不难有以下结论:
命题5.1
V1,V2是
K上的两个有限维线性空间,
V1,V2同构的充分必要条件为
dim(V1)=dim(V2)
证:
必要性前面已经证明,仅证充分性:
设
dim(V1)=dim(V2),要证明
V1,V2同构,就要构造
V1到
V2的一个同构映射,设
e1,⋯,en是
V1的一组基,
ε1,⋯,εn是
V2的一组基,构造映射
f:V1→V2:
f(k1e1+⋯+knen)=k1ε1+⋯+knεn则
f(ei)=εi,i=1,⋯,n,并且
f是线性映射,并且由构造容易知道
f既是单射,又是满射。
于是,任意
K上的
n维线性空间,都与
Kn同构,从某种意义上来看,虽然抽象的线性空间十分抽象,不好把握,但是,其实质就是
n维向量空间。
线性映射的运算的空间
线性映射也可以作为集合的元素构成线性空间。我们记
V1→V2的全体线性映射为
M(V1,V2),记
V上的线性变换为
M(V)。
f1,f2∈M(V1,V2),定义
f1+f2:V1→V2,对任意的
x∈V1:
(f1+f2)(x)=f1(x)+f2(x)对任意的
k∈K,定义
kf:V1→V2,对任意的
x∈V1:
(kf)(x)=kf(x)只需要验证其满足线性空间的八条运算性质即可:
(1)
(f1+f2)(x)=f1(x)+f2(x)=f2(x)+f1(x)=(f2+f1)(x),∀x∈V1
(2)
(f1+f2+f3)(x)=f1(x)+f2(x)+f3(x)=f1(x)+(f2(x)+f3(x))=(f1+(f2+f3))(x)
(3)
0:V1→V2定义成任意元素都映射为0,
0+f=f
(4)
∀f∈M(V1,V2),−f=(−1).f
其他四条验证是类似的,
M(V1,V2)构成一个线性空间,自然地,
M(V)也是一个线性空间。
M(V)有着一般线性空间没有的运算就是运算的复合,就是运算的乘法。
∀f1,f2∈M(V),
f1f2定义为
∀x∈V,
(f1f2)(x)=f1(f2(x)),容易验证
f1f2还是
V上的线性变换,这样,
M(V)上可以定义出多项式。这里我们不再做详细的论述。
线性映射与矩阵
下面我们讨论线性映射和矩阵的关系。假设
f是
V1到
V2的线性映射,其中,
V1和
V2都是
K上的有限维线性空间,
dim(V1)=n,
dim(V2)=m,设
e1,⋯,en是
V1的一组基,
b1,⋯,bm是
V2的一组基。则
⎩⎪⎪⎪⎨⎪⎪⎪⎧f(e1)=a11b1+⋯+a1mbmf(e2)=a21b1+⋯+a2mbm⋯f(en)=an1b1+⋯+anmbm可以看到,以上方程式就类似于线性方程组,我们也写成形式矩阵乘法的形式:
f(e1,⋯,en)=(b1,⋯,bm)A其中矩阵
A=⎣⎢⎢⎡a11a12⋯a1ma21a22a2m⋯⋯⋯an1an2anm⎦⎥⎥⎤当然也可以写成转置的形式,这里不再赘述。
A就称为
f在基
e1,⋯,en到
b1,⋯,bm下的矩阵。如果
f是
V上的线性变换,
dim(V)=n<∞,任取
e1,⋯,en为
V的一组基,则
⎩⎪⎪⎪⎨⎪⎪⎪⎧f(e1)=a11e1+a12e2+⋯+a1nenf(e2)=a21e1+a22e2+⋯+a2nen⋯f(en)=an1e1+an2e2+⋯+annen写成形式矩阵的形式即为
f(e1,⋯,en)=(e1,⋯,en)A
其中
A=⎣⎢⎢⎡a11a12⋯a1na21a22a2n⋯⋯⋯an1an2ann⎦⎥⎥⎤
A就称为线性变换
f在
e1,⋯,en下的矩阵。对线性映射,我们需要两组基确定一个矩阵,但对线性变换,只需要一组基就可以确定一个矩阵。对线性映射
f:V1→V2,对于确定的两组基,就可以确定一个唯一的矩阵,反过来,给定两组基,给定一个矩阵,可以构造出一个线性映射,对于线性变换亦是如此,这就说明,线性映射空间
M(V1,V2)和相应的矩阵空间是一一对应的,并且还是线性同构的,容易验证:
α1f1+α2f2在两组基下的矩阵等于各自在这两组基下矩阵的线性组合,说明
M(V1,V2)到矩阵空间的这一一对一映射还是线性映射。为了说明这点,我们简单验证一点性质即可
f,g是
V1到
V2的线性映射,
e1,⋯,en是
V1的一组基,
ε1,⋯,εm是
V2的一组基,
f在
e1,⋯,en到
ε1,⋯,εm的矩阵是
A,而
g在两组基下的矩阵是
B,则
αf+βg在这两组基下的矩阵为
αA+βB。
假设
A=(aij),B=(bij),则
f(ej)=i=1∑maijεij=1,⋯,n同样地
g(ej)=i=1∑mbijεij=1,⋯,n于是,就有
(αf+βg)(ej)=i=1∑m(αaij+βbij)εij=1,⋯,n这就验证了
αf+βg在两组基下的矩阵为
αA+βB。同样地,
M(V)和
Mn(K)是线性同构的。据此,我们可以提出如下的观点,在线性代数领域:
矩阵是线性映射的矩阵
矩阵和线性映射的关系可以总结为:
(1)矩阵是线性映射的矩阵,是线性映射的具体表现
(2)矩阵为线性映射的相关计算提供了手段
不仅如此,还容易验证,线性映射复合的矩阵就等于矩阵的乘法。这样,我们就把抽象的线性空间上的线性映射和具体的矩阵联系在了一起。矩阵运算都有了相应的意义。
接下来的一个问题是:对于同一个线性变换
f∈M(V),其中,
dim(V)=n,选择不同的基,线性变换的在不同基下的矩阵有何关系呢?在引出线性映射的矩阵时,我们给出了一种形式矩阵的运算。我们先给出形式矩阵运算的一个基本性质。
e1,⋯,en是
V的一个向量组,
A是一个
n阶矩阵,
B也是一个
n阶矩阵,则
[(e1,⋯,en)A]B=(e1,⋯,en)(AB)其中
A是
n×m矩阵,
B是
m×k矩阵,只需要作简单的验证即可。设
A=(aij),B=(bij),则\
令
(β1,⋯,βm)=(e1,⋯,en)A,则
βi=j=1∑naijeji=1,⋯,m再设
(γ1,⋯,γk)=(β1,⋯,βm)B,于是
γi=s=1∑mbsiβs=s=1∑mbsi(j=1∑najsej)=j=1∑ns=1∑m(ajsbsi)ej其中
i=1,⋯,k,这就验证了
(γ1,⋯,γk)=(e1,⋯,en)(AB)假设线性变换
f在基
e1,⋯,en下的矩阵为
A,就有
(f(e1),⋯,f(en))=(e1,⋯,en)A再假设
β1,⋯,βn是
V的另一组基,设
(β1,⋯,βn)P=(e1,⋯,en)同时
(β1,⋯,βn)=(e1,⋯,en)Q于是
(e1,⋯,en)(PQ)=(e1,⋯,en)由于
e1,⋯,en是
V的一组基,并且坐标具有唯一性,就有
QP=In因此
P可逆,并且有
f(e1,⋯,en)=f(β1,⋯,βn)P=(e1,⋯,en)A=(β1,⋯,βn)(PA)两边同右乘
P−1,就有
f(β1,⋯,βn)=(β1,⋯,βn)(PAP−1)实际上,
P是
(β1,⋯,βn)到
(e1,⋯,en)的过渡矩阵,或称基变换矩阵,
P−1是\
(e1,⋯,en)到
(β1,⋯,βn)的过渡矩阵。
f在
β1,⋯,βn下的矩阵为
B=PAP−1下面我们定义
n阶方阵的相似关系:
定义5.4
A,B是数域
K下的
n阶方阵,如果存在
n阶可逆方阵
P,使得
B=PAP−1则称
A和
B是相似矩阵
由上面的论述,同一线性变换在不同基下的矩阵是相似关系。并且容易验证:相似关系满足自反性,对称性和传递性,是一个等价关系,这样,我们就可以利用相似关系将
n阶矩阵划分成若干个等价类。在同一等价类内,不同矩阵对应不同的一组基,自然地,我们就像寻找等价类内一组"最好"的基,使得
f在这组基下的矩阵"最简单",最好简单到对角矩阵。这就是特征值和特征向量要研究的问题。
线性变换的特征值与特征向量
特征值问题的引入
前面我们讲过,线性变换在不同基下的矩阵是相似的关系,这就启发我们去寻找一组"最好"的基,使线性变换在这组基下的矩阵"最简单",最简单的矩阵莫过于对角矩阵。即
f(e1,⋯,en)=(e1,⋯,en)D
(e1,⋯,en)是
V的一组基,
D=diag(λ1,⋯,λn)。于是
f(ei)=λieii=1,⋯,n线性变换
f只是将
ei进行了伸缩变换,对任意的
x=a1e1+⋯+anen,于是
f(x)=i=1∑naiλiei我们发现,在这组基下,线性变换变得"异常简单"。接下来线性代数的中心问题,就是寻找一组基,矩阵"最简单",本章讲述矩阵是对角阵的情形,在最后两章,我们讲述不能对角化的情况下,最简单的矩阵,即"约当标准型"。
定义5.5
V是
K上的
n维线性空间,
f是
V上的线性变换,如果存在
λ∈K及非零向量
e∈V,满足:
f(e)=λe则称
λ是
f的特征值,
e是
λ对应的特征向量
如果有
n个线性无关的特征向量,那么自然就可以对角化,否则就不能对角化。那么,怎么寻找
n个线性无关的特征向量呢?我们先任取一组基
(e1,⋯,en),设
f在这组基下的矩阵为
A=(aij),设
x=x1e1+⋯+xnen是
λ的特征向量。则
f(x)=(e1,⋯,en)A(x1,⋯,xn)T=(e1,⋯,en)λ(x1,⋯,xn)T于是得到方程组
Ax=λx这里的
x是
n维列向量
(x1,⋯,xn)T,这个方程组由非零解等价于行列式
det(A−λIn)=0而这个行列式是关于
λ的
n次多项式,并且,并且,如果
B和
A相似,存在可逆矩阵
P,使得
B=PAP−1,由行列式的性质,就有
det(B−In)=det(P(A−λIn)P−1)=det(A−λIn)可见特征多项式和基的选取无关,因而,特征多项式既可以称为是线性变换的特征多项式,又可以称为是矩阵的特征多项式。特征值既可以称为是线性变换的特征值,又可以称为是矩阵的特征值。并且方程组
(A−λIn)x=0求解出来的
n维向量是特征向量对应的坐标,这样我们就得到了特征向量和特征值的计算方法。下面我们引入特征空间的概念,对于
λ∈K,称
Vλ={x:f(x)=λx}为
λ对应的特征空间,容易验证特征空间是子空间,如果
λ不是特征值,特征空间是零空间,如果是特征值,特征空间非零,就有重数,称为
λ的几何重数。
可对角化的充要条件
什么情况下
f可对角化呢,很显然
定理5.4
f是
K上
n维线性空间
V上的线性变换,
f可对角化的充要条件是存在
n个线性无关的特征向量。
假设线性变换的特征多项式为
h(λ),由于
h是
n次多项式,由代数基本定理,
h有
n个复根。特征值与否当然要看数域,在复数域上一定有
n个特征值(含重根),更小的数域则不一定。实线性空间上的线性变换的就不一定有
n个特征值。
命题5.2
f是
K上
n维线性空间
V上的线性变换,
e1,⋯,es是
f对应不同特征值的特征向量,则
e1,⋯,es线性无关
证:
设
e1,⋯,es对应的特征值为
λ1,⋯,λs。设
x1e1+⋯+xses=0两边用
f作用
x1λ1e1+⋯+xsλses=0用数学归纳法对
s进行归纳,
s=1时,结论显然成立。
假设
s=k时结论成立,
s=k+1时,第一个向量等式两边乘以
λ1,两个向量等式相减,就可以证得结论。
由数学归纳法,结论成立。
推论5.1
f是
K上
n维线性空间
V上的线性变换,
e1,⋯,es是
s个不同的数
λ1,⋯,λs特征空间中的向量,如果
e1+e2+⋯+es=0则
e1=⋯=es=0
证:
如果
e1,⋯,es不全为0,那么,至少有两个向量不为0。
不妨设至少
e1,e2全不为0,两边用
f作用,有
λ1e1+⋯+λses=0而
λ1,λ2不全为0,与
e1,⋯,es中非零向量线性无关矛盾。
命题5.3
f是
K上
n维线性空间
V上的线性变换,
λ1,⋯,λs是
f的
s个全部不同的特征值,则
f可对角化的充要条件是各特征值几何重数的和为
n
证:
λi(i=1,⋯,s)特征子空间的一组基
eij,j=1,⋯,ni,令
i=1∑sj=1∑nikijeij=0与上面的推论,有
j=1∑nikijeij=0,i=1,⋯,s于是
kij=0,i=1,⋯,s,j=1,⋯,ni,于是
f可对角化
我们已经指出,全部特征值由特征多项式
det(A−λIn)=0计算得到。特征根在多项式中的重数称为代数重数。
命题5.4
f是
K上
n维线性空间
V上的线性变换,
λ0是
f的特征值,则其几何重数不超过其代数重数
证:
设
λ0的特征空间的几何重数为
r,设其中一组基为
e1,⋯,er,将其扩张为
V的一组基
e1,⋯,en,则
f在这组基下的矩阵为
[λ0Ir0AB]于是,由分块矩阵行列式计算性质,
f的特征多项式为
(λ0−λ)rdet(B−λIn−r)=0而
λ0还可能是
det(B−λIn−r)=0的根
这说明了,
f可对角化,要满足两点:
(1)
f的特征多项式的根都在数域
K内
(2)
f的所有特征值的代数重数都等于几何重数
同时,每个特征值的特征空间的维度至少为1,因此,就有如下的命题:
命题5.5
f是
K上
n维线性空间
V上的线性变换,如果
f有
n个不同的特征值,则
f可对角化