笔记:宾大《Algebra, Topology, Differential Calculus, and Optimization Theory For CS and ML》——第三章第九节

3.9 线性形式和对偶空间

定义3.26 对于一个给定的向量空间 E E ,线性映射 E K E \rarr K 对应的向量空间 H o m ( E , K ) Hom(E,K) 被称为 E E 对偶空间(dual space),可以表示为 E E^* ,同时在 E E^* 中的线性映射被称为线性形式(linear forms)或者余向量(covectors)。 E E^* 对应的对偶空间 E E^{**} 被称为 E E 二次对偶(bidual)。

我们也可以将线性形式 f : E K f:E \rarr K 用星号表示,即 u , x u^*,x^* 等。

如果 E E 是一个 n n 维的向量空间,且其基为 ( u 1 , . . , u n ) (u_1,..,u_n) ,对于任意的线性形式 f E f^* \in E^* ,对于任意的线性组合 x = x 1 u 1 + + x n u n E x=x_1u_1+…+x_nu_n \in E ,我们有
f ( x ) = f ( u 1 ) x 1 + . . . + f ( u n ) x n = λ 1 x 1 + . . . + λ n x n f^*(x)=f^*(u_1)x_1+...+f^*(u_n)x_n=\lambda_1x_1+...+\lambda_nx_n
因此,关于基 ( u 1 , u n ) (u_1,…u_n) 线性组合 f f^* 可以用行向量表示
λ 1 . . . λ n (\lambda_1...\lambda_n)
所以我们有
f ( x ) = λ 1 . . . λ n ( x 1 x n ) f^*(x)=(\lambda_1...\lambda_n)\left( \begin{matrix} x_1\\ \vdots \\ x_n \end{matrix} \right)
我们可以将线性组合 f f^* 视为线性等式,我们可以用一个列向量表达系数,即
c = ( c 1 c n ) c=\left( \begin{matrix} c_1\\ \vdots \\ c_n \end{matrix} \right)
所以我们可以将上面的线性组合 f f^* 表达为
f ( x ) = c T x f^*(x)=c^Tx
这种表达方式也就是我们在机器学习中常见的表达方式,下面是例子:

例子1 对于任意的可微函数 f : R n R f:\R^n \rarr \R ,对于任意的 x R n x \in \R^n ,其对应的在 x x 处的导数(derivation) d f x df_x 可以用上面的线性形式表示,即对于所有的 u = ( u 1 , u n ) u=(u_1,…u_n)
d f x u = ( f x 1 ( x ) . . . f x n ( x ) ) ( u 1 u n ) = i = 1 n f x i ( x ) u i df_x(u)=(\frac{\partial f}{\partial x_1}(x)...\frac{\partial f}{\partial x_n}(x))\left( \begin{matrix} u_1\\ \vdots \\ u_n \end{matrix} \right)= \sum_{i=1}^n\frac{\partial f}{\partial x_i}(x)u_i
所以给出一个向量空间 E E 和其任意的基 ( u i ) i I (u_i)_{i \in I} ,我们都可以联系到每一个 u i u_i 对应的线性形式。并且这些 u i u_i^* 有一些性质。

例子2 C ( [ 0 , 1 ] ) C([0,1]) 这个向量空间中定义一个连续的函数 f : [ 0 , 1 ] R f:[0,1] \rarr \R ,其对应的映射 L : C ( [ 0 , 1 ] ) R L:C([0,1]) \rarr \R 定义如下:对于任意的 f C [ 0 , 1 ] f \in C[0,1]
L ( f ) = 0 1 f ( x ) d x L(f)=\int^1_0{f(x)}{\rm d}x
其为一个线性形式,由于其为连续的,所以其也就是积分的形式。

例子3 考虑一个实数矩阵 n × n n \times n 对应的向量空间 M n ( R ) M_n(\R) ,设一个函数为 t r : M n ( R ) R tr:M_n(\R) \rarr \R ,具体的定义为
t r ( A ) = a 11 + a 22 + . . . + a n n tr(A) = a_{11}+a_{22}+...+a_{nn}
这个表达被称为矩阵 A A (trace),其也是一个线性形式。为了更清楚的表示其线性形式,我们将其写为
s ( A ) = i , j = 1 n a i j s(A) = \sum_{i,j=1}^na{ij}
其中 A = ( a i j ) A=(a_{ij})

定义3.27 对于一个线性空间 E E 和其对应的基 ( u i ) i I (u_i)_{i \in I} ,对于每一个 i I i \in I 都有唯一的线性形式 u i u_i^* ,其形式为:
u i ( u j ) = { 1 , i f   i = j 0 , i f   i j u_i^*(u_j)=\left\{\begin{array}{cc} 1, & if\ i = j\\ 0, & if\ i \ne j \end{array}\right.
这种线性形式 u i u_i^* 被称为关于索引 i i 坐标形式(coordinate form),可以写为基 ( u i ) i I (u_i)_{i \in I}

Note:对于一个索引集 I I ,我们通常定义其为“Kronecker symbo”,即 δ i j \delta_{ij}
δ i j = { 1 , i f   i = j 0 , i f   i j \delta_{ij}=\left\{\begin{array}{cc} 1, & if\ i = j\\ 0, & if\ i \ne j \end{array}\right.
u i u_i^* 是在坐标系中的第 i i 个坐标对应的线性函数。

定理3.20 (对偶基的存在性定理)令 E E 为一个 n n 维的向量空间,那么有以下的性质:对于每一个 E E 的基 ( u 1 , , u n ) (u_1,…,u_n) ,坐标形式的 E E^* 的基 ( u 1 , , u N ) (u_1^*,…,u_N^*) 被称为 ( u 1 , , u n ) (u_1,…,u_n) 的对偶基。

特别地,我们也可以看出对于一个有限维度的向量空间,其对偶空间 E E^* 拥有和原向量空间 E E 相同的维度。

预告

3.10 第三章知识和定义的总结

猜你喜欢

转载自blog.csdn.net/qq_39867051/article/details/106732388