我的微信公众号名称:AI研究订阅号
微信公众号ID:MultiAgent1024
公众号介绍:主要研究强化学习、计算机视觉、深度学习、机器学习等相关内容,分享学习过程中的学习笔记和心得!期待您的关注,欢迎一起学习交流进步!
我们曾经用内积定义了向量空间中一个元素的长度,它是几何长度的推广,利用这个长度的概念我们可以讨论极限、逼近的问题。在分析解决这些问题时最重要的是利用了长度的基本性质、非负性、齐次性和三角表达式。
向量的范数
范数的定义
- 定义4.1:若对任意的
x∈Cn都有一个实数
∣∣x∣∣与之对应,且满足:
- 非负性:
x=0时,
∣∣x∣∣>0,当
x=0时,
∣∣x∣∣=0;
- 齐次性:对任意的
k∈C,
∣∣kx∣∣=∣k∣⋅∣∣x∣∣;
- 三角不等式:对任意的
x,
y
∈Cn都有:
∣∣x+y∣∣≤∣∣x∣∣+∣∣y∣∣
则称
∣∣x∣∣为
Cn上的向量范数,简称向量范数。
几种常见的范数
设:
x=(x1,x2,⋯,xn)T∈Cn
规定:
∣∣x∣∣2=i=1∑n∣xi∣2
很容易证明这是范数,叫作向量的2范数。2范数在酉变换下不变。
设:
x∈Cn
规定:
∣∣x∣∣1=i=1∑n∣xi∣
则
∣∣x∣∣1是范数,叫做向量的1范数。
设:
x∈Cn
规定:
∣∣x∣∣∞=maxi∣xi∣
则
∣∣x∣∣∞是范数,叫做向量的
∞范数。
设
x∈Rn,规定,
∣∣x∣∣p=(∑∣xi∣p)p1
则
∣∣x∣∣p也是范数,叫做向量的
p范数。
规定:
∣∣f∣∣=max∣f(x)∣
则
∣∣f∣∣是函数的范数
在连续函数的空间中,规定:
∣∣f(x)∣∣=∫ab∣f(x)∣dx
则
∣∣f∣∣也是范数。
生成范数
在一个向量空间之中可以构造无穷多种范数,前面所述只是最常用的范数。下面给出从已知范数构造新的向量范数的方法。
x=(x1,x2,⋯,xn)T∈Cn
规定
∣∣x∣∣=a∣∣x∣∣1+b∣∣x∣∣2 (a,b>0)
则
∣∣x∣∣是范数。
- 例5 设
A∈Cnm×n,
∣∣⋅∣∣a是
Cm上的一种范数,对于任意的
x∈Cn,规定
∣∣x∣∣=∣∣Ax∣∣a,则
∣∣x∣∣是
Cn上的范数。
由于矩阵
A可以有无穷多,所以用这种方法可以构造无穷多种范数。
范数的等价
- 定义4.2:给定
Cn上的向量序列
{xk},其中
xk=(x1k,x2k,⋯,xnk) (k=1,2,⋯)
如果:
lim∞xik=xi
则称
{xk}收敛,记作:
limk→∞xk=x
不收敛的序列叫作发散序列。
- 定理4.1
Cn中的向量序列
{xk}收敛于
x的充分必要条件是,对于
Cn上的范数
∣∣⋅∣∣∞,
lim∞∣∣xk−x∣∣∞=0
收敛是向量序列的性质,这种性质不应该受到度量方式的影响,也就是一个向量序列在一种范数的意义下收敛,那么它在另一种范数的意义下也应该收敛。一个空间中的序列在一种范数下收敛,那么它在另一种范数下也是收敛的。
- 定义4.3 设
∣∣x∣∣a和
∣∣x∣∣b是
Cn上的两种向量范数,如果存在正数
k和
l使得对于任意的
x都有:
k∣∣x∣∣b≤∣∣x∣∣a≤l∣∣x∣∣b
则称向量范数
∣∣x∣∣a和
∣∣x∣∣b等价。
- 定理4.2:
Cn空间上所有范数等价。
即若
{xk}在
∣∣⋅∣∣∞意义下收敛,则
{xk}在
∣∣x∣∣意义下也收敛。向量序列的收敛不受范数选择影响。
同一个向量在不同的范数下长度一般不同,如:
x=(1,1,⋯,1)∈Cn
则:
∣∣x∣∣2=n
,∣∣x∣∣1=n, ∣∣x∣∣∞=1
相差很大,但是在讨论收敛时,效果也是一样的,但是要注意,这里讨论的是有限维的空间,无穷维空间可以不等价。
矩阵的范数
由于一个
m×n矩阵可以看作
m×n维向量,因此可以按照定义向量范数的方法来定义矩阵范数,但是矩阵之间还有矩阵的乘法,在研究矩阵范数时应该给予考虑。
方阵的范数
- 定义4.4 :若对于任意的
A∈Cn×n都有一个实数
∣∣A∣∣与之对应,且满足:
- 非负性:
A=O,
∣∣A∣∣>0;
A=O,
∣∣A∣∣=0;
- 齐次性:对任意的
k∈C:
∣∣kA∣∣=∣k∣ ∣∣A∣∣
- 三角不等式:对任意的
A,B∈Cn×n,
∣∣A+B∣∣≤∣∣A∣∣+∣∣B∣∣
- 相容性:对任意的
A,B∈Cn×n都有
∣∣AB∣∣≤∣∣A∣∣⋅∣∣B∣∣
则称
∣∣A∣∣为
Cn×n上矩阵的范数,简称矩阵范数。
- 由于定义中的前三条与向量范数一致,因此矩阵范数有与向量范数有类似的性质,如:
∣∣−A∣∣=∣∣A∣∣,∣ ∣∣A∣∣−∣∣B∣∣ ∣≤∣∣A−B∣∣
以及
Cn×n上的两个矩阵范数等价。
常用的范数
与
∣∣x∣∣1相仿,设
A=(aij)n×n∈Cn×n,规定:
∣∣A∣∣m1=i,j∑∣aij∣
则
∣∣A∣∣m1是
Cn×n上的矩阵范数,称为
m1范数。
与
∣∣x∣∣2相仿,对于
A=(aij)n×n,规定:
∣∣A∣∣F=i,j∑∣aij∣2
=tr(AHA)
则
∣∣A∣∣F是
Cn×n上的一种矩阵范数,称为矩阵的Frobenius范数,简称
F范数。
设
A=(aij)n×n,规定:
∣∣A∣∣m∞=n⋅maxi,j∣aij∣
则
∣∣A∣∣m∞是
Cn×n上的矩阵范数。
与向量范数的相容性
- 定义4.5:设
∣∣⋅∣∣m是
Cn×n上的矩阵范数,
∣∣⋅∣∣v是
Cn上的向量范数,对任意的
A∈Cn×n,
x∈Cn,都有:
∣∣AX∣∣v≤∣∣A∣∣m∣∣x∣∣v
则称矩阵范数
∣∣⋅∣∣m与向量范数
∣∣⋅∣∣v是相容的。
-
Cn×n上的
m1范数与
Cn上的1范数相容。
-
Cn×n上的
F范数与
Cn上的2范数相容。
用矩阵范数来定义向量范数
- 设
∣∣⋅∣∣是
Cn×n上的一种矩阵范数,则在
Cn上可以定义一种向量范数。以二维空间为例,如设
x∈C2,取
α=(α1,α2)T=0 ,设
∣∣⋅∣∣m1是
C2×2中的范数,任取:
A=(aij)2×2∈C2×2
则:
∣∣A∣∣m1=∣a11∣+∣a12∣+∣a21∣+∣a22∣
现在任取:
x∈C2,x=(x1,x2)T
则:
xαH=(x1x2)(αˉ1αˉ2)=(x1αˉ1x2αˉ1x1αˉ2x2αˉ2)
是
C2×2的矩阵。规定:
∥x∥=∥∥xαH∥∥m1=∣x1αˉ1∣+∣x1αˉ2∣+∣x2αˉ1∣+∣x2αˉ2∣
则在
C2中定义了一种运算。
α=(1,2)T,x=(1,1)T
则:
∥x∥=∥∥xαH∥∥m1=∥∥∥∥(11)(1,2)∥∥∥∥m1=6
取:
α=(1,i)T,x=(1,1)
则:
∣∣x∣∣=∣∣xαH∣∣m1=4
- 定理4.3:设
∣∣⋅∣∣是
Cn×n上的一种范数,则在
Cn上必存在与它相容的向量范数。
从属范数
前面介绍了由矩阵范数定义向量范数的方法,接下来将要介绍由向量范数来定义矩阵范数的方法。
我们知道,单位矩阵在矩阵的乘法中的作用类似于1在乘法中的作用。但是对于已经知道的矩阵范数,如
m1,
F,
m∞范数,
n阶单位矩阵
E的范数。
∣∣E∣∣m1=n,∣∣E∣∣F=n
,∣∣E∣∣m∞=n
能否构造出使得
∣∣E∣∣=1的范数呢?
- 定理4.4:已知
Cn上的向量范数
∣∣⋅∣∣v,对于任意的
A∈Cn×n,规定:
∣∣A∣∣=maxx=0∣∣x∣∣v∣∣Ax∣∣v
则
∣∣A∣∣是
Cn×n上的矩阵范数,称为由向量范数
∣∣⋅∣∣v导出的矩阵范数,简称导出范数或者从属范数。
从属范数的计算
从属范数的计算是求多元函数的最大值,计算并不容易,我们只就向量的1,2,
∞导出的矩阵范数分别是
∣∣A∣∣1,
∣∣A∣∣2,
∣∣A∣∣∞,则:
-
∣∣A∣∣1=maxj∑i=1n∣aij∣。
-
∣∣A∣∣∞=maxi∑j=1n∣aij∣。
-
∣∣A∣∣2=λ1
,
λ1为
AHA的最大特征值。
∣∣A∣∣1是矩阵
A的元素取模,然后把每一列元素加起来,取这些列和的最大值。而
∣∣A∣∣∞是把每行的模加起来,然后取最大值。
范数的应用举例
-
定义4.6:设
A∞Cn×n,
λ1,λ2,⋯,λn是
A的
n个特征值,称
ρ(A)=maxi∣λi∣为
A的谱半径,即
A的谱半径是
A的特征值模的最大值。
-
定理4.6:设
A∈Cn×n,则对
Cn×n上的任何一个矩阵范数
∣∣⋅∣∣m,都有:
ρ(A)≤∣∣A∣∣m
- 定理4.7:设
A∈Cn×n,任取一个正数,都可以找到一个矩阵范数
∣∣⋅∣∣,使得:
∣∣A∣∣≤ρ(A)+ε