向量空间
向量空间的定义
向量空间就是解析几何中的平面向量和空间向量的进一步抽象。回顾解析几何的知识,平面中两个线性无关的向量可以线性表示整个平面上所有的向量,也就是说,对于任意的平面向量
v及两个线性无关的向量
e1,e2,都存在实数
x1,x2
v=x1e1+x2e2
(x1,x2)称为
v在
e1,e2下的坐标。有了两个线性无关的平面向量,所有平面都和一个实数对一一对应,同样地,所有空间向量都和一个三维实数对具有一一对应的关系。同时,向量的加法(按平行四边形法则)就是实数对各变元相加,向量的数乘就是实数对各变元乘以该实数。我们将这一规则从二、三维推广到n维,就得到n维向量空间。
定义2.1
K是一个数域,
(x1,x2,⋯,xn)的各变元都是
K中的数,全体这样的
n元数对构成的集合称为
n维向量空间
n维向量空间实际上就是
n维空间的一个"点",只不过在二维和三维,我们有明确的几何直观,二维的点就是平面上的一个点或平面上的一个向量,三维的点就是空间上的一个点或空间的一个向量。在超过四维的情况下,我们就无法想象几何上的
n维向量到底“长成什么样”,不过形式是
n维实数对。我们规定:
n维向量空间上的加法为各变元分别相加,数乘为各变元分别乘以该常数。我们就在
n维向量空间上,建立了两个运算。并且,按照数域的运算性质,容易验证
n维向量空间有如下的运算性质:
(1)(加法交换律)
x1+x2=x2+x1
(2)(加法结合律)
x1+x2+x3=x1+(x2+x3)
(3)(零元)
0+x=x
(4)(存在相反元)
x+(−x)=0
(5)(数乘交换律)
(ab)x=a(bx)
(6)(数乘结合律)
(a+b)x=ax+bx
(7)(数乘结合律)
a(x1+x2)=ax1+ax2
(8)(单位元)
1.x=x
这样,向量就好像“数”一样与数域中的数一起参与运算,这就启发我们:能运算的,不仅仅只有数,即是是抽象的集合中的元素,也是可以通过定义某种运算,具有某种运算规律,就可以如同数一样进行运算,这样,我们对代数的认识,就从具体,走向抽象,可以认为:抽象,就是现阶段代数的核心!
当然,我们不是为了抽象而进行抽象,向量空间有其明确的几何背景,那就是解析几何中的二维平面向量空间和三维立体几何向量空间,所以,接下来的任务,我们要将平面解析几何和立体解析几何的若干观念,推广到
n维向量空间当中。
向量空间的结构
接下来,我们将解析几何中的若干观念,推广到
n维向量空间中去。我们知道,平面解析几何中,两个向量平行,就等价于存在实数
k,
x1=kx2,此时
x1−kx2=0两个向量不平行,那么就不存在实数
k,使得
x1=kx2,如果假设
k1x1+k2x2=0那么,就一定有
k1=k2=0,否则,假设
k1=0,那么
x1=−k1k2x2如果两个向量不平行,那么,平面上任意向量,都可以表为这两个向量的线性组合。
x=k1x1+k2x2对于
n维向量,同样有线性相关,线性无关,线性组合的概念。
定义2.2
x1,⋯,xm是数域
K上的
n维向量空间的一个向量组,
k1,⋯,km∈K,称向量
k1x1+k2x2+⋯+kmxm是
x1,⋯,xm的一个线性组合。
定义2.3
x1,⋯,xm是
K上的
n维向量空间的一个向量组,如果存在
K上的一组不全为
0的数
k1,⋯,km∈K,使得线性组合
k1x1+k2x2+⋯+kmxm=0则称
x1,⋯,xm线性相关,否则称
x1,⋯,xm线性无关
下面我们给出线性相关和线性无关的一个等价定义
定理2.1
x1,⋯,xm是
K上的
n维向量空间的一个向量组,
x1,⋯,xm线性相关的充要条件是存在某个向量能被其他向量线性表示
证:
x1,⋯,xm线性相关,则存在不全为
0的
K中的数
k1,⋯,km,满足
k1x1+k2x2+⋯+kmxm=0不失一般性,不妨设
k1=0,则
x1=−k11[k2x2+⋯+kmxm]
这就说明了,向量组线性相关,就等价于某个向量是"多余"的,体现在该向量能表示成其他向量的线性组合,去掉该向量和保留该向量,前后的向量组是等价的。那么何谓向量组的等价呢?
定义2.4
x1,⋯,xs,
y1,⋯,yt是
K上的
n维向量空间的两个向量组,如果每个
xi都能被
y1,⋯,yt线性表出,则称
x1,⋯,xs能被
y1,⋯,yt线性表示;如果两个向量组可以相互线性表示,则称两个向量组等价。
容易验证,向量组之间的等价是一个等价关系,即满足自反性,对称性和传递性。容易证明,如果向量组线性相关,去掉能被其他向量线性表示的向量后,两个向量组是等价的,这就足以说明线性相关的原因是因为存在某些多余的向量,剔除掉多余的向量,前后向量组等价。
那么,我们自然联想到,对于线性相关的向量组,我们逐个找到能被其他向量线性表示的向量,予以剔除,直到向量组线性无关,就得到完全没有多余向量的向量组,并且,新的向量组可以线性表出原来线性相关的向量组,就像新的线性无关的向量组就像原来的向量组的一个“不平行的平面向量”一般,通过线性组合就能得到原来的所有向量,这是“基”这个概念的雏形,只不过,在向量组这里,我们称为“极大线性无关组”。
以上过程得到的“极大线性无关组”可能会受到剔除顺序的影响的,不同的剔除顺序得到的极大线性无关组都不同,但是,同一个线性相关向量组通过以上过程得到的极大线性无关组,在向量的数量上是相等的,这就是空间的维度。下面,我们对这里观点进行严格的论证。
为了论述这个结论,我们先讨论齐次方程有非零解的一种特殊情况。
引理2.1 对数域
K上的齐次线性方程组
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0
如果
n>m,则齐次方程必有非零解
证:
用数学归纳法对
m进行归纳:
m=1时,如果
n≥2,则方程组等价于1个方程
a11x1+a12x2+⋯+a1nxn=0
如果
a11=0,那么
(1,0,⋯,0)即是一组非零解。否则,
(a12,−a11,0,⋯,0)即是一组非零解。
假设
m=k时结论都成立,对
k+1个方程,如果
n>k+1,不妨设
a11,⋯,am1不全为0,否则
(1,0,⋯,0)即是一组非零解。可以通过初等变换,方程等价于
⎩⎪⎪⎪⎨⎪⎪⎪⎧x1+b12x2+⋯+b1nxn=00x1+b22x2+⋯+b2nxn=0⋯0x1+b(k+1)2x2+⋯+b(k+1)nxn=0由归纳假设,方程组
⎩⎪⎨⎪⎧b22x2+⋯+b2nxn=0⋯b(k+1)2x2+⋯+b(k+1)nxn=0存在一组非零解
(x20,⋯,xn0),再令
x10=−b12x20+⋯−b1nxn0 ,这样,
(x10,x20,⋯,xn0)就是方程组的一组非零解。
定理2.2
x1,⋯,xs和
y1,⋯,yt是数域
K上
n维向量空间的两个向量组,
x1,⋯,xs能被
y1,⋯,yt线性表出,
y1,⋯,yt线性无关,
s>t,则
x1,⋯,xs线性相关
证:
由
x1,⋯,xs能被
y1,⋯,yt线性表出,则存在
mn个
K中的数
kij,使得
⎩⎪⎪⎪⎨⎪⎪⎪⎧x1=k11y1+⋯+k1tytx2=k21y1+⋯+k2tyt⋯xs=ks1y1+⋯+kstyt令
z1,⋯,zs∈S,并且
z1x1+z2x2+⋯+zsxs=0由
y1,⋯,yt线性无关,就得到线性方程组
⎩⎪⎪⎪⎨⎪⎪⎪⎧k11z1+k21z2+⋯+ks1zs=0k12z1+k22z2+⋯+ks2zs=0⋯k1tz1+k2tz2+⋯+kstzs=0由于
s>t,方程的未知量个数大于方程的个数,那么,方程必有非零解,这就说明了
x1,⋯,xs线性相关
推论2.1
x1,⋯,xs和
y1,⋯,yt是数域
K上
n维向量空间的两个线性无关的向量组,并且等价,那么
s=t
定义2.5
x1,⋯,xm是数域
K上
n维向量空间的一个的向量组,
y1,⋯,ys是
x1,⋯,xm的一个子向量组,如果满足:
(1)
y1,⋯,ys线性无关
(2)
x1,⋯,xm可由
y1,⋯,ys线性表出
则称
y1,⋯,ys是
x1,⋯,xm的极大线性无关组
任何向量组的极大线性无关组一定存在,但不唯一,但按照推论\ref{cor1},极大线性无关组的向量个数一定是确定的,称极大线性无关组的向量个数是向量组的秩。
向量组的秩,就如图向量组的维数,规定向量组最少可以由其中多少个向量线性表出。
最后,我们来给出向量组和线性方程组之间的联系。对线性方程组
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0
实际上,我们可以表成
x1a1+x2a2+⋯+anxn=0其中
ai=(a1i,⋯,ami),这样,线性相关就相当以上齐次线性方程组由非零解,线性无关就相当于以上其次线性方程只有零解。
向量组的秩和矩阵的秩
接下来,我们搭起向量组和矩阵之间的桥梁。向量组我们可以写成矩阵的形式,将向量组元素按列排列就是列向量,按行排列就是行向量,那么,任何矩阵都可以视为一个行向量组和列向量组。下面,我们来给出行向量组和列向量组的联系。行向量组的秩称为矩阵的行秩,列向量组的秩为矩阵的列秩
定理2.3 初等行变换不改变矩阵的行秩
证:
设矩阵
A的行向量组为
x1,x2,⋯,xn
交换第
i和
j行不改变行向量组的构成,交换第
i行和第
j行后行向量组等价。
将第
i行乘以一个非零常数
k,则行向量组变为
x1′=x1,⋯,xi−1′=xi−1,xi′=kxi,xi+1′=xi+1,⋯,xn′=xn
⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧x1=x1′⋯xi−1=xi−1′xi=k1xi′xi+1=xi+1′⋯xn=xn′
因此,前后的行向量组等价。
类似地,可以验证将
i行加上第
j行的
k倍后,前后的行向量组等价。
因此,初等行变换后矩阵的行向量组都等价,初等行变换不改变矩阵的行秩
当然,初等行变换也不改变矩阵的列秩。
定理2.4 初等行变换不改变矩阵的列秩
证:
设
y1,⋯,ym是矩阵的列向量组,其极大线性无关组为
z1,⋯,zs。
再设
zi=(zi1,⋯,zin),那么方程组
⎩⎪⎪⎪⎨⎪⎪⎪⎧z11x1+z21x2+⋯+zs1xs=0z12x1+z22x2+⋯+zs2xs=0⋯z1nx1+z2nx2+⋯+zsnxs=0只有零解,交换两行相当于交换
zi的两个变元,相当于交换方程组的两个方程,某行乘以
k倍相当于
zi对应变元乘以
k倍,相当于线性方程组对应行乘以
k倍,将第
j行的
k倍加到第
i行相当于将第
j个分量的
k加到第
i个分量,相当于将第
j个方程的
k倍加到第
i个方程。
因而初等行变换后不改变极大线性无关组的线性无关性。只要证明变换后得到的
z1′,⋯,zs′是
y1′,⋯,yn′的极大线性无关组即可。实际上,由于
z1,⋯,zs是
y1,⋯,yn的极大线性无关组,对任意的
i=1,⋯,n,存在
K中的常数
x1,⋯,xs,使得:
yi=x1z1+⋯+xszs设
yi=(yi1,⋯,yin),写成线性方程组形式为
⎩⎪⎪⎪⎨⎪⎪⎪⎧yi1=z11x1+z21x2+⋯+zs1xsyi2=z12x1+z22x2+⋯+zs2xs⋯yin=z1nx1+z2nx2+⋯+zsnxs初等行变换相当于交换两个方程,某个方程乘以
k倍,将某个方程的
k倍加到另一个方程,初等行变换前后方程组都成立,因此,
z1′,⋯,zs′是
y1′,⋯,yn′的极大线性无关组
推论2.2 初等列变换不改变矩阵的行秩和列秩
我们知道,任何矩阵都可以通过初等行变换化为行阶梯状矩阵。即
i≤r,第
i行第
si列为
1,前面的列为
0,后
n−r行全为0,并且
1≤s1<⋯<sr≤n。再通过初等列变换,可以将矩阵化成如下的形式:
⎣⎢⎢⎡1⋯0100⎦⎥⎥⎤以上矩阵称为矩阵的标准型,通过标准型,我们就不难得到
定理2.5 矩阵的行秩和列秩相等
我们就称矩阵的行秩或列秩为矩阵的秩,矩阵
A的秩记为
r(A)。以上过程也提供了求解矩阵的秩的方法,就是利用矩阵的初等变换,化为阶梯阵或者标准型。
线性方程组解的结构
对于线性方程组,我们最感兴趣的问题方程组有无解?如果有,有多少解,也就是解的个数。关于这个问题,我们不妨将所有解视为一个空间,考察解空间的结构。
我们先来考察齐次线性方程组的解的结构。对齐次线性方程组
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0我们关心的问题是齐次线性方程组是否有非零解。我们将所有的解记成
n维向量的形式,全体解的集合记为
V,容易验证:
(1)
x1,x2∈V,则
x1+x2∈V
(2)
x∈V,k∈K,则
kx∈V
也就是说,
V对向量的加法和数乘是封闭的。我们把
V称为齐次线性方程组的解空间。正如平面上所有向量可由两个不共线的向量线性表出,空间上所有向量可由三个不共面的向量线性表出。解空间也有这么一组基,所有解都可以表为这组基的线性组合。
类似地,我们就猜想
V是
K上齐次线性方程组
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0的解空间,存在有限个线性无关的解向量
τ1,⋯,τs,方程组任意解可表为该向量组的唯一的线性组合。
定理2.6 对
K上齐次线性方程组
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0
V是其解空间,
A是其系数矩阵,
r=r(A),则存在
n−r个线性无关的解向量
τ1,⋯,τn−r,
V中任意向量可表为
τ1,⋯,τn−r的线性组合
证:
设
a1,⋯,an是
A的列向量组。
如果
r(A)=n,方程组等价于
x1a1+x2a2+⋯+xnan=0由
a1,⋯,an线性无关,方程组仅有零解。
如果
r<n,不妨设
a1,⋯,ar是
a1,⋯,an的极大线性无关组,那么
ar+1,⋯,an能被
a1,⋯,ar线性表出,设
⎩⎪⎪⎪⎨⎪⎪⎪⎧ar+1=k11a1+⋯+kr1arar+2=k12a1+⋯+kr2ar⋯an=k1(n−r)a1+⋯+kr(n−r)ar代入,就有
i=1∑r(xi+xr+1ki1+⋯+xnki(n−r))ai=0再由
a1,⋯,ar线性无关,就可以得到方程组
⎩⎪⎪⎪⎨⎪⎪⎪⎧x1+xr+1k11+⋯+xnk1(n−r)=0x2+xr+1k21+⋯+xnk2(n−r)=0⋯xr+xr+1kr1+⋯+xnkr(n−r)=0(1)对
i=1,⋯,n−r,令
τi=(−k1i,⋯,−kri,0,⋯,0,1,0,⋯,0)即第
r+i个变元取1,前
r个变元取
(−k1i,⋯,−kri),其余变元取0。容易验证
τ1,⋯,τn−r是方程组的解向量,并且线性无关。
任意线性方程组的解必然满足方程组(1)。这样,设
(x1,⋯,xr,xr+1,⋯,xn)是方程组的解,就有
⎝⎜⎜⎛x1x2⋯xr⎠⎟⎟⎞=i=1∑n−rxr+i⎝⎜⎜⎛−k1i−k2i⋯−kri⎠⎟⎟⎞于是
⎝⎜⎜⎜⎜⎜⎜⎜⎜⎛x1x2⋯xrxr+1⋯xn⎠⎟⎟⎟⎟⎟⎟⎟⎟⎞=i=1∑n−rxr+iτi即任意解向量都可以表为
τ1,⋯,τr的线性组合
这就证明了基础解系的存在性,并且由基础解系的构造,任意齐次线性方程组任意两个基础解系的向量个数是一致的。并且,由上面的证明过程,我们知道
xr+1,⋯,xn是可以任取的,取定一组值,
x1,⋯,xr随之确定,就得到齐次方程组的一组解,这
n−r个元就称为自由变元。总结上面的论述,就有:
定理2.7 齐次线性方程组的系数矩阵为
A,
n为未知数个数,
r=r(A),则方程组有非零解的充要条件是
r<n,并且解空间的维数是
n−r
至此,我们完美地解决了齐次线性方程组的求解问题。现在,我们转入到非齐次方程组的求解问题。对非齐次线性方程组
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+⋯+a1nxn=b1a21x1+⋯+a2nxn=b2⋯am1x1+⋯+amnxn=bm我们记系数矩阵为
A,增广矩阵为
A。系数矩阵的列向量组为
a1,⋯,an,常数项向量为
β,方程组就等价于
a1x1+⋯+anxn=β也就是
β能否被
a1,⋯,an线性表出。
引理2.3
x1,⋯,xm∈Kn是
Kn上线性无关的向量组,
βinKn,如果
x1,⋯,xm,β线性相关,则存在唯一的一组
k1,⋯,km∈K,使得
β=k1x1+⋯+kmxm
证:
由于
x1,⋯,xm,β,存在不全为0的一组数
k1,⋯,km,km+1,使得
k1x1+⋯+kmxm+km+1β=0如果
km+1=0,那么
k1,⋯,km不全为0,并且
k1x1+⋯+kmxm=0与
x1,⋯,xm线性无关矛盾,因此
km+1=0,即
β=−km+11k1x1+⋯+kmxm这就证明了存在性,再证唯一性,假设
β=k1x1+⋯+kmxm
β=l1x1+⋯+lmxm那么
(k1−l1)x1+⋯+(km−lm)xm=0由
x1,⋯,xm线性无关,就有
ki=lii=1,⋯,m
定理2.8 非齐次线性方程组的系数矩阵为
A,增广矩阵为
A,则方程组有解的充要条件是
r(A)=r(A)
证:
设
A的列向量组为
a1,⋯,an,常数项向量为
β
必要性,假设方程组有解,那么
β能被
a1,⋯,an线性表出,因此,
a1,⋯,an,β\和
a1,⋯,an等价,从而秩相等,因此
r(A)=r(A)
充分性,假设
r(A)=r(A),反证法,假设
β不能被
a1,⋯,an线性表出,设
a1′,⋯,as′是
a1,⋯,an的极大线性无关组,那么
a1′,⋯,as′,β一定线性无关,否则
β能被
a1′,⋯,as′线性表出,与假设矛盾,这样
r(A)≥r(A)+1>r(A)又与
r(A)=r(A)矛盾,矛盾的根源在假设了
β不能被
a1,⋯,an线性表出,故
β能被
a1,⋯,an线性表出,齐次线性方程组有解
假设非齐次方程组有解,那么解空间又是何种结构呢?设非齐次线性方程组的解空间是
V,如果
x1∈V,对任意的
x∈V,
x−x1就是齐次方程的解。也就是说,假设
τ1,⋯,τn−r是齐次方程的基础解系,那么存在
c1,⋯,cn−r,使得
x=x1+c1τ1+⋯+cn−rτn−r反过来,对任意的常数
c1,⋯,cn−r,向量
x1+c1τ1+⋯+cn−rτn−r必定是非齐次方程的解,也就是说,任何非齐次方程的解等于某个特解+齐次方程的通解。至此,我们已经明晰了非齐次方程和齐次方程解的结构,我们对上面的论述,总结到如下定理:
定理2.9 非齐次线性方程的系数矩阵为
A,增广矩阵为
A,未知数个数为
n,则
(1)
r(A)=r(A)时方程组无解
(2)
r(A)=r(A)=n时,方程组有唯一解
(3)
r(A)=r(A)<n时,方程组有无穷多组解
至此,我们彻底回答了如何求解线性方程组,线性方程组有无解,有多少解的问题。而我们回答这些问题的过程,是借助向量空间而非直接对数的运算进行讨论的,我们也可以看到,方程组有界还是无解的问题,齐次方程有无非零解的问题,本质上是向量空间的向量组线性相关还是线性无关,向量组的秩,以及某个向量能否被系数矩阵向量组线性表示的问题。可见,要解决一个代数方程的问题,我们不一定要直接对数的运算进行讨论。更多的是认清代数方程背后的抽象代数系统的代数结构,这就是代数学的核心与精髓。
矩阵论初步
矩阵的加法和数乘
上一章,我们将矩阵视为向量的组合,这一章,我们把矩阵视为单独的元素,赋予矩阵一些运算,使矩阵也成为一个代数系统。我们将会看到,能"算"的,不仅仅只有数和向量,甚至矩阵也能"算"。
我们记全体
K上的
m行
n列矩阵为
Mm,n,定义
Mm,n上的加法是对应位置的数相加,即
⎣⎡a11⋯am1a12⋯am2⋯⋯⋯a1n⋯amn⎦⎤+⎣⎡b11⋯bm1b12⋯bm2⋯⋯⋯b1n⋯bmn⎦⎤=⎣⎡a11+b11⋯am1+bm1a12+b12⋯am2+bm2⋯⋯⋯a1n+b1n⋯amn+bmn⎦⎤矩阵的数乘定义为
k⎣⎡a11⋯am1a12⋯am2⋯⋯⋯a1n⋯amn⎦⎤=⎣⎡ka11⋯kam1ka12⋯kam2⋯⋯⋯ka1n⋯kamn⎦⎤由数域的运算规律,容易验证,矩阵空间
Mm,n也有如下的八条运算规律:
(1)
A∈Mm,n,B∈Mm,n,
A+B=B+A
(2)
A,B,C∈Mm,n,A+B+C=A+(B+C)
(3)
0+A=A∀A∈Mm,n
(4)
−A+A=0∀A∈Mm,n
(5)
1.A=A∀A∈Mm,n
(6)
kl.A=k(lA)∀A∈Mm,n,k,l∈K
(7)
k(A+B)=kA+kB∀k∈K,A,B∈Mm,n
(8)
(k+l)A=kA+lA∀k,l∈K,A∈Mm,n
矩阵在这个层面上运算性质和向量相类似。
矩阵的乘法
接下来我们引入矩阵的乘法。我们先引入线性变换的概念,只不过在这里我们是狭义的线性变换,对
n维向量
(x1,⋯,xn),我们可以通过变换
⎩⎪⎨⎪⎧y1=a11x1+⋯+a1nxn⋯ym=am1x1+⋯+amnxn将其变换为
m维向量,我们姑且称为线性变换。矩阵
A=⎣⎡a11⋯am1⋯⋯⋯a1n⋯amn⎦⎤就称为线性变换的矩阵,我们再将
(y1,⋯,ym)通过线性变换,变换为
(z1,⋯,zk),线性变换矩阵为
B=⎣⎡b11⋯bk1⋯⋯⋯b1m⋯bkm⎦⎤两个线性变换的复合,也是线性变换,我们代入验证就可以说明这点:
zi=bi1y1+⋯+bimym=bi1(a11x1+⋯+a1nxn)+⋯+bim(am1x1+⋯+amnxn)=(s=1∑mbisas1)x1+⋯+(s=1∑mbisasn)xn其中:
1≤i≤k,两个线性变换的复合还是线性变换,矩阵为
⎣⎡∑s=1mb1sas1⋯∑s=1mbksas1⋯⋯⋯∑s=1mb1sasn⋯∑s=1mbksasn⎦⎤
我们就定义这个矩阵是
A和
B的乘积,下面我们给出一个正式的定义:
定义2.6
A=(aij)是
K上的
n×m矩阵,
B=(bij)是
K上的
m×k矩阵,定义
A和
B的乘积为
AB=⎣⎡∑s=1mb1sas1⋯∑s=1mbksas1⋯⋯⋯∑s=1mb1sasn⋯∑s=1mbksasn⎦⎤
与数域乘法不同的是,矩阵的乘法,没有交换律,这是很明显的一个事实,因为
AB有意义,
BA不一定有意义,即使两者都有意义,也不一定相等。下面我们来验证矩阵乘法的一些运算规律。
(1)
A∈Mn,m,B,C∈Mm,s,A(B+C)=AB+AC
(2)
A,B∈Mn,m,C∈Mm,s,(A+B)C=AC+BC
(3)
A∈Mn,m,B∈Mm,s,k∈K,kAB=(kA)B=A(kB)
(4)
A∈Mn,t,B∈Mt,k,C∈Mk,m,ABC=A(BC)
我们仅验证(1)(4),(2)(3)的验证和(1)类似,这里省略
设
A=(aij),
B=(bij),C=(cij),则
B+C=(bij+cij)因此,设
A(B+C)=(dij)则
dij=s=1∑mais(bsj+csj)=s=1∑maisbsj+s=1∑maiscsj
因此,
A(B+C)=AB+AC
(4)设
A=(aij),B=(bij),C=(cij)
AB=(s1=1∑tais1bs1j)于是
(AB)C=(s2=1∑k(s1=1∑tais1bs1s2)cs2j)=(s2=1∑ks1=1∑t(ais1bs1s2cs2j))=(s1=1∑ts2=1∑k(ais1bs1s2cs2j))=(s1=1∑t[ais1s2=1∑kbs1s2cs2j])而
BC=(s2=1∑kbs1s2cs2j)故
(AB)C=A(BC)这说明了矩阵乘法有结合律。
有了矩阵的乘法,我们就可以用矩阵乘法的形式,表示线性方程组,对于线性方程组
⎩⎪⎨⎪⎧a11x1+⋯+a1nxn=b1⋯am1x1+⋯+amnxn=bm系数矩阵的为
A,未知量矩阵是
x1,⋯,xn组成的列向量,记为
x,常数项矩阵是
b1,⋯,bm组成的列向量,记为
b,则方程组就可以用组成表示为
Ax=b线性变换又可以表示为
y=Ax这也就不难理解为什么线性变换的复合的矩阵是矩阵的乘法了。这是因为,对于另一个线性变换
z=By就有
z=By=B(Ax)=(BA)x
接下来,我们要给出矩阵乘法和初等变换之间的关系。对角元全为1,其他全为0的
n阶方阵称为
n阶单位矩阵,记为
In,交换
In的
i,j两列或
i,j两列得到的矩阵记为
En(i,j),设
En(i,j)=(ekt),则
ekt=⎩⎪⎪⎪⎨⎪⎪⎪⎧1110k=t=i,jk=i,t=jk=j,t=iotherwise对
m×n矩阵
A,就有
Em(i,j)A=(s=1∑neksast)注意到
k=i,j时
s=1∑neksast=akt
s=1∑neisast=ajt
s=1∑nejsast=ait可见:
Em(i,j)A相当于交换
A的
i,j两行,同理可以验证
AEn(i,j)相当于交换
A的
i,j两列。
令
En(i:k)是
In的第
i行(或第i列)乘以
k倍,其中
k=0,
A左乘
Em(i:k)相当于
A的第
i行乘以
k倍,右乘
En(i:k)相当于
A的第
i列乘以
k倍
令
En(i,j:k)为
In的第
i行的
k倍加到第
j行,左乘
Em(i,j:k),相当于将
A的第
i行的
k倍加到第
j行,右乘
En(i,j:k)相当于把
A的第
i列加到第
j列。
我们称以上三种类型的矩阵为初等矩阵,就有:
(1)初等行变换相当于左乘相应的初等矩阵
(2)初等列变换相当于右乘相应的初等矩阵
这样,我们就把初等变换和矩阵乘法联系起来了。
矩阵的转置
m×n矩阵
A=(aij)的转置定义为
n×m矩阵
(aji),记为
AT。显然,矩阵的转置只是改变矩阵的形状,原来的行向量组变为转置矩阵的列向量组,原来的列向量组变为转置矩阵的行向量组,因而,矩阵的转置不改变矩阵的秩。即
r(A)=r(AT)下面,我们来验证转置矩阵的相关性质:
(1)
A,B∈Mm,n,(A+B)T=AT+BT
(2)
A∈Mm,n,(kA)T=kAT
(3)
A∈Mm,t,B∈Mt,n,(AB)T=BTAT
(1)(2)是显然的,我们仅验证(3):
设
A=(aij),B=(bij),则
AB=(s=1∑taisbsj)设
AT=(aji)=(cij),BT=(bji)=(dij)因此
(AB)T=(s=1∑tajsbsi)=(s=1∑tcsjdis)=BTAT
方阵的逆矩阵
方阵的逆矩阵和"数"的逆元是类似的。在数域上有"1"这个数,我们把全体
n阶方阵记为
Mn,则
In在
Mn中充当的作用就相当于"1"在数域中充当的作用,即对任意的
A∈Mn,都有
AIn=InA=A。在数域上有倒数的概念,在
Mn中的倒数就是所谓的逆矩阵。
定义2.7
A∈Mn,如果存在
B∈Mn,使得
AB=In则称
A为可逆矩阵,或非奇异矩阵,
B称为
A的逆矩阵,记为
A−1,否则称
A为不可逆矩阵,或奇异矩阵
满足什么条件
n阶方阵可逆呢?我们假设逆矩阵
A−1存在,记其列向量组为
b1,⋯,bn,记
ei为第
i个变元为1,其他变元为0的列向量,就有以下
n个方程组:
Abi=ei(i=1,⋯,n)存在矩阵
B使得
AB=In的充要条件是以上
n个方程组都有解。满足什么条件就会有以上
n个方程组都有解呢?如果
r(A)=n,那么以上
n个方程组增广矩阵的秩一定等于
n,
n个方程组都有解,如果
r=r(A)<n,设
A的行向量组为
β1,⋯,βn,不妨设
β1,⋯,βr是行向量组的极大线性无关组。则第
n个方程的增广矩阵可表为
⎣⎢⎢⎢⎢⎡β1β2⋯βn−1βn0001⎦⎥⎥⎥⎥⎤由于
β1,⋯,βr是极大线性无关组,则
βr+1,⋯,βn可由
β1,⋯,βr线性表出,那么,就可以通过初等行变换,将增广矩阵化为
⎣⎢⎢⎢⎢⎢⎢⎢⎢⎡β1⋯βr0⋯0000001⎦⎥⎥⎥⎥⎥⎥⎥⎥⎤这说明
r(A)=r(A),也就是说存在某个方程组无解,
A一定不可逆。这样,我们就得到了
A可逆的一个充要条件
r(A)=n。同时由上面的论述,逆矩阵的每个列向量都是某个方程的解,并且,每个方程都只有唯一解,因此,逆矩阵也是唯一的
定理2.10
n阶方阵
A可逆的充要条件是
r(A)=n,并且逆矩阵若存在,必唯一
定理2.11
n阶方阵
A可逆,则
A=(A−1)−1
也就是
A和
A−1互为逆矩阵。为了证明这个定理,我们首先给出一个引理:
引理2.2 初等矩阵的都是可逆矩阵,并且
En−1(i,j)=En(i,j)
En−1(i:k)=En(i:k1)(k=0)
En−1(i,j:k)=En(i,j:−k)
同时
En−1(i,j)En(i,j)=In
En(i:k1)En−1(i:k)=In
En(i,j:−k)En−1(i,j:k)=In
这个引理直接验证即可
引理2.3 可逆矩阵可经过有限步初等列变换化为单位矩阵
证:
用数学归纳法证明:
对一阶方阵
A=(a11),
A可逆的充要条件是
a11=0,故只要除以
a11,就能化为单位矩阵。
假设
k阶可逆方阵都可以经过有限步初等列变换化为单位矩阵,考虑
k+1阶可逆方阵
A=⎣⎢⎢⎡a11a21⋯a(k+1)1a12a22a(k+1)2⋯⋯⋯a1ka2ka(k+1)ka1(k+1)a2(k+1)a(k+1)(k+1)⎦⎥⎥⎤
那么
a11,⋯,a1(k+1)必定不全为0,否则
r(A)=k+1。第一列除以
a11,再第
i列加上第1列的
−a1i倍,将矩阵化为
A2⎣⎢⎢⎡1b21⋯b(k+1)10b22b(k+1)2⋯⋯⋯0b2(k+1)b(k+1)(k+1)⎦⎥⎥⎤再令
B=⎣⎡b22⋯b(k+1)2⋯⋯b2(k+1)b(k+1)(k+1)⎦⎤则
B一定可逆,否则
r(A)<k+1,则由归纳假设,可以仅仅通过对
A2后
k列进行初等列变换,将
A2化为
A3=⎣⎢⎢⎢⎢⎡1b21b31⋯b(k+1)101⋯101⎦⎥⎥⎥⎥⎤
A3的第
1列加上第
i列的
−bi1倍即可将
A3化为单位矩阵
(i=2,⋯,k+1)
由数学归纳法,结论成立
引理2.4 任何可逆矩阵都可表为有限个初等矩阵的乘积
证:
设
A可逆,则
r(A)=n,则
A可以经过有限步初等列变换化为
In,也就是说,存在初等矩阵
E1,⋯,Em,使得
AE1⋯Em=In于是
A=Em−1⋯E1−1
E1−1,⋯,Em−1都是初等矩阵
下面证明定理2.11:
证:
由
A可逆,存在有限个初等矩阵
E1,⋯,Em,使得
A=E1⋯Em因此
E1⋯EmA−1=In于是,就有
A−1=Em−1⋯E1−1因此
A−1A=Em−1⋯E1−1E1⋯Em=In第二个等号是通过重复使用矩阵乘法的结合律得到的
这样,逆矩阵实际上就是
Mn上的一种运算,下面,我们给出逆运算和矩阵乘法
定理2.12
A,B都是
n阶可逆方阵,则
AB也可逆,并且
(AB)−1=B−1A−1
证:
要证明
AB可逆,只需要证明齐次方程组
ABx=0只有零解,实际上,由
A可逆,故方程组
Ay=0只有零解,于是
Bx=0而
B可逆,故
x=0,因此
AB可逆,同时
ABB−1A−1=A(BB−1)A−1=AA−1=In因此
(AB)−1=B−1A−1
定理2.13
A是
n阶可逆方阵,则
AT也可逆,并且
(AT)−1=(A−1)T
证:
由于转置不改变矩阵的秩,因此
AT也可逆。同时
AT(A−1)T=(A−1A)T=InT=In
我们再回到线性方程组求解的问题上,
A是
n阶方阵,如果
A可逆,那么对于任意的
b∈Kn,方程组
Ax=b两边左乘
A−1,就可以求得方程组的解
x=A−1b这是方程组解的矩阵表示。
矩阵的运算与矩阵的秩
本节,我们来讨论矩阵的加法、数乘、乘法和矩阵的秩的关系。在这之前,我们先给出一个简单的命题。
命题2.1
x1,⋯,xn,y1,⋯,ym∈Kn,如果
x1,⋯,xn能被
y1,⋯,ym线性表示,那么
x=(x1,⋯,xn)的秩不超过
y=(y1,⋯,ym)的秩
证:
设
x1,⋯,xr为
x的极大线性无关组,
y1,⋯,ys是
y的极大线性无关组。则
x1,⋯,xr能被
y1,⋯,ys线性表示,
r≤s
定理2.14
A,B∈Mm,n,则
r(A+B)≤r(A)+r(B)
证:
设
a1,⋯,an是
A的列向量组,
b1,⋯,bn是
B的列向量组,则
a1+b1,⋯,an+bn是
A+B的列向量组,则该向量组能被
a1,⋯,an,b1,⋯,bn线性表示,而设
a1,⋯,ar是
A的列极大线性无关组,
b1,⋯,bs是
B的列极大线性无关组,因此
r(A+B)≤r(a1,⋯,an,b1,⋯,bn)
r(a1,⋯,an,b1,⋯,bn)≤r(a1,⋯,ar,b1,⋯,bs)≤r+s
定理2.15
A∈Mm,k,B∈Mk,n,则
r(AB)≤min(r(A),r(B))
证:
设
B的列向量组为
b1,⋯,bn,极大线性无关组为
b1′,⋯,br′,则
AB的列向量组为
Ab1,⋯,Abn,那么
Ab1,⋯,Abn能被
Ab1′,⋯,Abr′线性表示,因此
r(AB)≤r(B)设
A的行向量组为
a1,⋯,am,极大线性无关组为
a1′,⋯,as′,则
AB的行向量组为
a1B,⋯,amB,那么
a1B,⋯,amB能被
a1′B,⋯,as′B线性表示,因此
r(AB)≤r(A)
定理2.16
A∈Mm,n,B∈Mn,t,则
r(AB)≥r(A)+r(B)−n
证:
设
B的列向量组为
b1,⋯,bt,
r1=r(B),那么
Ab1,⋯,Abt是
AB的列向量组,再设
Ab1′,⋯,Abr1′是
Ab1,⋯,Abt的极大线性无关组,于是,
Abi能被
Ab1′,⋯,Abr1′线性表示。设
Abi=ki1Ab1′+⋯+kir1Abr1′则
bi−ki1b1′+⋯−kir1br1′是齐次方程组
Ay=0的解,设
P1,⋯,Pr2是其基础解系,则
bi=ki1b1′+kir1br1′+ki1′P1+⋯+kir2′Pr2因此
r(B)≤r(AB)+n−r(A)
向量空间的基与基变换
本节的最后,我们来补充向量空间上的基和基变换的相关理论。我们知道在平面上任意两个线性无关的向量可以线性表示平面上所有向量,空间上任意三个线性无关的向量可以线性表示空间上所有的向量,当然,这对于
n维向量空间也是成立的。
定理2.17
Kn上任意
n个线性无关的向量可以唯一线性表示
Kn的所有向量
证:
对任意的
β∈Kn,
a1,⋯,an是
Kn中
n个线性无关的向量,
β能被\
a1,⋯,an,等价于方程组
a1x1+⋯+anxn=β有解,并且表示的系数是方程组的解,令
A=(a1,⋯,an),方程组等价于
Ax=β则由于
r(A)=n,因此,
A可逆,并且
x=A−1β方程组有解并且解是唯一的
现在我们有两组基
a1,⋯,an和
b1,⋯,bn,由于
b1,⋯,bn是
Kn的一组基,那么
a1,⋯,an能被
b1,⋯,bn唯一线性表示,令
⎩⎪⎨⎪⎧a1=k11b1+⋯+k1nbn⋯an=kn1b1+⋯+knnbn则
(a1,⋯,an)=(b1,⋯,bn)⎣⎡k11⋯k1n⋯⋯⋯kn1⋯knn⎦⎤令
K=⎣⎡k11⋯k1n⋯⋯⋯kn1⋯knn⎦⎤
K称为基变换矩阵,给定一组基
b1,⋯,bn,对任意
x∈Kn,都存在
x1,⋯,xn,
x=x1b1+⋯+xnbn。
(x1,⋯,xn)称为
x在基
b1,⋯,bn下的坐标。假设
K是
b1,⋯,bn到
a1,⋯,an的基变换矩阵,
x∈Kn,在
b1,⋯,bn下坐标向量为
y,在
a1,⋯,an下坐标向量为
z,则令
B=(b1,⋯,bn),A=(a1,⋯,an),就有
B=AK
x=By=AKy=Az由坐标的唯一性
Ky=z因此,左乘
K就能将
b1,⋯,bn下的坐标转换为
a1,⋯,an下的坐标,这就是
Kn下的坐标变换公式
分块矩阵的乘法及求逆
分块矩阵是常用的计算矩阵的手法。所谓分块就是将矩阵划分为若干块,每一块都是一个子矩阵,即
A=⎣⎢⎢⎡A11A21⋯Am1A12A22⋯Am2⋯⋯⋯⋯A1nA2n⋯Amn⎦⎥⎥⎤其中
Aij是
mi×nj矩阵,那么
A就是
M=∑i=1mmi行
N=∑j=1nni列矩阵,对矩阵进行分块之后,求矩阵的乘法,我们就可以利用各个击破的方法,再设
B=⎣⎡B11⋯Bn1B12⋯Bn2⋯⋯⋯B1t⋯Bnt⎦⎤其中
Bij是
ni×tj矩阵,那么,就有
AB=⎣⎡∑s=1nA1sBs1⋯∑s=1nAmsBs1∑s=1nA1sBs2⋯∑s=1nAmsBs2⋯⋯⋯∑s=1nA1sBst⋯∑s=1nAmsBst⎦⎤这是因为,设
AB=(cij),
cij只与
A中
i行所在行有交集的块以及
B中
j列有交集的块有关,再经过形式复杂但比较初等的验证之后就有以上的结论。对角矩阵即形如
⎣⎢⎢⎡a1a2⋯an⎦⎥⎥⎤的矩阵,记为
diag(a1,⋯,an),单位矩阵就是一种特殊的对角矩阵,如果
a1,⋯,an=0,那么其逆矩阵就是
diag(a1−1,⋯,an−1)类似地,我们可以将对角矩阵推广成准对角矩阵
⎣⎢⎢⎡A1A2⋯An⎦⎥⎥⎤只不过这里
Ai是
ni阶的可逆方阵,同样地,其逆矩阵为
⎣⎢⎢⎡A1−1A2−1⋯An−1⎦⎥⎥⎤对于准对角矩阵
⎣⎢⎢⎡A1A2⋯An⎦⎥⎥⎤其秩就等于
∑i=1nr(Ai)这样,分块之后,求秩和求逆矩阵就可以逐个击破,分别求解。
定理2.18 给定数域
K上的分块矩阵
M=[A0CB]有
r(A)+r(B)≤r(M)
证:
设
A的列向量组为
a1,⋯,as,
C的列向量组为
c1,⋯,ct,
B的列向量组为
b1,⋯,bt,则
M的列向量组为
d1,⋯,ds,ds+1,⋯,ds+t其中
di=[ai0](i=1,⋯,s)
ds+i=[cibi](i=1,⋯,t)设
a1,⋯,as的极大线性无关组为
an1,⋯,anr1
,
b1,⋯,bt的极大线性无关组为
bm1,⋯,bmr2。\
则
dn1,⋯,dnr1,ds+m1,⋯,ds+mr2也是线性无关的,
并且能被
d1,⋯,ds+t线性表示,因此
r(M)≥r1+r2=r(A)+r(B)