瑞利熵
瑞利熵
R ( M , x ) = x ∗ M x x ∗ x
R
(
M
,
x
)
=
x
∗
M
x
x
∗
x
此处的
x
x
是一个向量,矩阵
M
M
是一个Hermitian矩阵,即该矩阵共轭对称,
M i j = M ∗ j i
M
i
j
=
M
j
i
∗
,如果
M
M
是一个实矩阵,则有
M T = M
M
T
=
M
。
瑞利熵的特点是:最大值和最小值分别等于矩阵
M
M
最大和最小的特征值。
λ m i n ⩽ x ∗ M x x ∗ x ⩽ λ m a x
λ
m
i
n
⩽
x
∗
M
x
x
∗
x
⩽
λ
m
a
x
可以用拉格朗日乘子法证明:
s . t . max R ( M , x ) = max x ∗ M x x ∗ x = c
max
R
(
M
,
x
)
=
max
x
∗
M
x
s
.
t
.
x
∗
x
=
c
J ( x ) = x ∗ M x − λ ( x ∗ x − c ) ∂ J ( x ) ∂ x = 0 → M x = λ x R ( M , x ) = λ
J
(
x
)
=
x
∗
M
x
−
λ
(
x
∗
x
−
c
)
∂
J
(
x
)
∂
x
=
0
→
M
x
=
λ
x
R
(
M
,
x
)
=
λ
扫描二维码关注公众号,回复:
4846357 查看本文章
从上面的证明可以看出:
R ( M , x ) = λ
R
(
M
,
x
)
=
λ
,瑞利熵的值就是M的特征值,最值一致
x
x
的解正是
R ( M , x )
R
(
M
,
x
)
所对应的关于
M
M
的特征向量
广义瑞利熵
R ( M , N , x ) = x ∗ M x x ∗ N x
R
(
M
,
N
,
x
)
=
x
∗
M
x
x
∗
N
x
令
y = N − 1 / 2 x
y
=
N
−
1
/
2
x
x ∗ M x = y ∗ ( N − 1 / 2 ) ∗ M N − 1 / 2 y x ∗ N x = y ∗ ( N − 1 / 2 ) ∗ N N − 1 / 2 y = y ∗ y
x
∗
M
x
=
y
∗
(
N
−
1
/
2
)
∗
M
N
−
1
/
2
y
x
∗
N
x
=
y
∗
(
N
−
1
/
2
)
∗
N
N
−
1
/
2
y
=
y
∗
y
R ( M , N , y ) = y ∗ N − 1 / 2 M N − 1 / 2 y y ∗ y
R
(
M
,
N
,
y
)
=
y
∗
N
−
1
/
2
M
N
−
1
/
2
y
y
∗
y
根据瑞利熵的性质,
R ( M , N , y )
R
(
M
,
N
,
y
)
实际上是矩阵
N − 1 / 2 M N − 1 / 2
N
−
1
/
2
M
N
−
1
/
2
的特征值
拉普拉斯矩阵
定义
上面这个图
G =< V , E >
G
=<
V
,
E
>
可以定义两个矩阵:度矩阵
D
D
(Degree)和邻接矩阵
A
A
(Adjacent)
D = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ 4 0 0 0 0 0 2 0 0 0 0 0 3 0 0 0 0 0 3 0 0 0 0 0 2 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟
D
=
(
4
0
0
0
0
0
2
0
0
0
0
0
3
0
0
0
0
0
3
0
0
0
0
0
2
)
A = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ 0 1 1 1 1 1 0 1 0 0 1 1 0 1 0 1 0 1 0 1 1 0 0 1 0 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟
A
=
(
0
1
1
1
1
1
0
1
0
0
1
1
0
1
0
1
0
1
0
1
1
0
0
1
0
)
拉普拉斯矩阵的定义是:
L = D − A
L
=
D
−
A
D − A = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ 4 − 1 − 1 − 1 − 1 − 1 2 − 1 0 0 − 1 − 1 3 − 1 0 − 1 0 − 1 3 − 1 − 1 0 0 − 1 2 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟
D
−
A
=
(
4
−
1
−
1
−
1
−
1
−
1
2
−
1
0
0
−
1
−
1
3
−
1
0
−
1
0
−
1
3
−
1
−
1
0
0
−
1
2
)
性质
令函数
f ( v i )
f
(
v
i
)
表示结点
v i
v
i
的函数
f ∗ L f = f ∗ D f − f ∗ A f = ∑ i f 2 ( v i ) d i − ∑ i ∑ j A i j f ( v i ) f ( v j ) = 1 2 ( ∑ i f 2 ( v i ) d i − 2 ∑ i ∑ j A i j f ( v i ) f ( v j ) + ∑ j f 2 ( v j ) d j ) = 1 2 ∑ i ∑ j A i j ( f i − f j ) 2
f
∗
L
f
=
f
∗
D
f
−
f
∗
A
f
=
∑
i
f
2
(
v
i
)
d
i
−
∑
i
∑
j
A
i
j
f
(
v
i
)
f
(
v
j
)
=
1
2
(
∑
i
f
2
(
v
i
)
d
i
−
2
∑
i
∑
j
A
i
j
f
(
v
i
)
f
(
v
j
)
+
∑
j
f
2
(
v
j
)
d
j
)
=
1
2
∑
i
∑
j
A
i
j
(
f
i
−
f
j
)
2
这是一个欧氏距离加权求和的形式,特殊的让
A i j = 1
A
i
j
=
1
,则它就是所有点两两之间的距离之和。所以拉普拉斯矩阵是关于图中的点的一种基于欧氏距离的测度。 另外,显然拉普拉斯矩阵是半正定的,所有特征值都非负。所谓半正定矩阵,即对任意非零向量
x
x
都有
x ∗ L x ⩾ 0
x
∗
L
x
⩾
0
,看上面的式子显然成立。 那么拉普拉斯矩阵与瑞利熵有什么关系呢?简而言之,上面这个式子的计算,不需要遍历所有点之间的配对,根据瑞利熵的性质,可以简化为求拉普拉斯矩阵关于特征向量
f
f
的特征值,所以是一个特征值分解的过程,而矩阵分解又可以使用梯度下降实现,进一步简化。
参考文献
【Wiki】半正定矩阵 【博客】线性判别分析LDA原理总结 【博客】拉普拉斯矩阵(Laplace Matrix)与瑞利熵(Rayleigh quotient) 【Wiki】Rayleigh quotient