数据挖掘day9-CS229-Linear Algebra Review and Reference

因为计划先看的凸优化,但是发现其中很多符号不认识(不同的机构使用的不一定一样)。过两天才看到这个线性代数综述,我觉得应该是我的顺序搞反了,所以,将这一篇的日期顺序排的靠前点。其实我更推荐看原文章或翻译:中文翻译,不过这里我会把公式都打出来,主要是联系一下Latax。
(未完待填坑)

1、基本概念和符号

方程组:
4 x 1 5 x 2 = 13 4x_1-5x_2=-13
2 x 1 + 3 x 2 = 9 -2x_1+3x_2=9

可以写成线性代数的形式:

A x = b Ax=b 其中: A = [ 4 5 1 3 ] A=\left[\begin{matrix} 4&-5\\ -1&3 \end{matrix} \right] , b = [ 13 9 ] b=\left[\begin{matrix}-13\\ 9\end{matrix} \right]

1.1、基本符号

采用以下符号:
· A R m × n A \in \mathbb{R}^{m×n} ,表示一个m行n列的矩阵,并且矩阵A中的所有元素都是实数。
· x R n x \in \mathbb{R}^{n} ,表示一个含有n个元素的向量,通常,我们把n维向量看成是一个n行1列矩阵,即列向量。如果我们想表示一个行向量(1行n列矩阵),我们通常写作 x T x^T ,即x的转置。
· 向量的第i个元素写作 x i x_i

x = [ x 1 x 2 x n ] x=\left[\begin{matrix} x_1\\x_2\\ \vdots \\x_n \end{matrix} \right]

·采用 a i j ( o r A i j , A i , j , e t c ) a_{ij }(or A_{ij} , A_{i,j} , etc) 表示A的 i i j j 列元素

A = [ a 11 a 12 a 1 n a 21 a 22 a 2 n a m 1 a m 2 a m n ] A=\left[\begin{matrix} a_{11}&a_{12}& \cdots &a_{1n}\\a_{21}&a_{22}& \cdots &a_{2n}\\ \vdots& \vdots&\ddots&\vdots\\a_{m1}&a_{m2}& \cdots &a_{mn} \end{matrix} \right]

·采用 a j ( o r A : , j ) a_{j }(or A_{:,j} ) 表示A的 j j 列元素

A = [ a 1 a 2 a n ] A=\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]

·采用 a i T ( o r A i , : ) a_{i}^T(or A_{i,:} ) 表示A的 i i 行元素

A = [ a 1 T a 2 T a m T ] A=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]

2、矩阵乘法

百度百科-矩阵乘法
矩阵 A R m × n A \in \mathbb{R}^{m×n} B R n × P B \in \mathbb{R}^{n×P} 的乘积:
C = A B R m × p C=AB\in \mathbb{R}^{m×p}
其元素为 C i j = k = 1 n A i k B k j C_{ij}= \displaystyle \sum_{k=1}^nA_{ik}B_{kj}

2.1、向量乘积

内积:
x , y R n x,y \in \mathbb{R}^n ,的点积/内积为 x T y x^Ty ,是一个实数
x T y R = [ x 1 x 2 x n ] [ y 1 y 2 y n ] = i = 1 n x i y i x^Ty \in \mathbb{R}=\left[\begin{matrix} x_1&x_2&\cdots&x_n \end{matrix} \right] \left[\begin{matrix} y_1\\y_2\\ \vdots\\y_n \end{matrix} \right]= \displaystyle \sum_{i=1}^nx_{i}y_{i}

内积是矩阵乘法的特例,通常 x T y = y T x x^Ty=y^Tx

外积:
x R m , y R n x \in \mathbb{R}^m,y \in \mathbb{R}^n x y T R m × n xy^T \in \mathbb{R}^{m×n} 为向量的外积

x y T R m × n = [ x 1 x 2 x n ] [ y 1 y 2 y n ] = [ x 1 y 1 x 1 y 2 x 1 y n x 2 y 1 x 2 y 2 x 2 y n x m y 1 x m y 2 x m y n ] xy^T \in \mathbb{R}^{m×n}=\left[\begin{matrix} x_1\\x_2\\ \vdots\\x_n \end{matrix} \right] \left[\begin{matrix} y_1&y_2& \cdots&y_n \end{matrix} \right]= \left[\begin{matrix} x_1y_1&x_1y_2& \cdots &x_1y_n\\x_2y_1&x_2y_2& \cdots &x_2y_n\\ \vdots& \vdots&\ddots&\vdots\\x_my_1&x_my_2& \cdots &x_my_n \end{matrix} \right]

外积写法的例子, 1 R n 1 \in \mathbb {R}^n 是元素都为1的n维向量, A R m × n A \in \mathbb{R}^{m×n} 是m行n列矩阵,每一列都是 x R m x \in \mathbb{R}^m ,A可以简洁的写作

A = [ x x x ] = [ x 1 x 1 x 1 x 2 x 2 x 2 x m x m x m ] = [ x 1 x 1 x 1 ] [ y 1 y 2 y n ] = x 1 T A=\left[\begin{matrix} |&|& &|\\x&x& \cdots &x\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} x_1&x_1& \cdots &x_1\\x_2&x_2& \cdots &x_2\\ \vdots& \vdots&\ddots&\vdots\\x_m&x_m& \cdots &x_m\end{matrix} \right]=\left[\begin{matrix} x_1\\x_1\\ \vdots \\x_1 \end{matrix} \right]\left[\begin{matrix} y_1&y_2& \cdots&y_n \end{matrix} \right]=x1^T

2.2、矩阵-向量乘法

右乘列向量的写法:
矩阵 A R m × n A \in \mathbb{R}^{m×n} 与向量 x R n x \in \mathbb{R}^n 的乘积为向量 y = A x R m y=Ax \in \mathbb{R}^m
行的形式:
来写 A A x A,Ax y i = a i T x y_i=a_i^Tx

y = A x = [ a 1 T a 2 T a m T ] x = [ a 1 T x a 2 T x a m T x ] y=Ax=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]x=\left[\begin{matrix} — &a_1^Tx& — \\ — &a_2^Tx& — \\ &\vdots& \\ — &a_m^Tx& — \\ \end{matrix} \right]

列的形式:
来写 A A x A,Ax

y = A x = [ a 1 a 2 a n ] [ x 1 x 1 x 1 ] = [ a 1 ] x 1 + [ a 2 ] x 2 + + [ a n ] x n y=Ax=\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]\left[\begin{matrix} x_1\\x_1\\ \vdots \\x_1 \end{matrix} \right]=[a_1]x_1+[a_2]x_2+\cdots+[a_n]x_n

左乘行向量的写法:

A R m × n A \in \mathbb{R}^{m×n} , x R m x \in \mathbb{R}^m , y R n y \in \mathbb{R}^n ,则 y T = x T A y^T=x^TA

行的形式:

y T = x T A = x T [ a 1 a 2 a n ] = [ x T a 1 x T a 2 x T a n ] y^T=x^TA=x^T\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} x^Ta_1&x^Ta_2&\cdots&x^Ta_n\end{matrix} \right]

列的形式:

y T = x T A = [ x 1 x 2 x n ] [ a 1 T a 2 T a m T ] y^T=x^TA=\left[\begin{matrix} x_1&x_2&\cdots&x_n \end{matrix} \right] \left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]

= x 1 [ a 1 T ] + x 2 [ a 2 T ] + + x n [ a n T ] =x_1\left[\begin{matrix} — &a_1^T& — \end{matrix} \right]+x_2\left[\begin{matrix} — &a_2^T& — \end{matrix} \right]+\cdots+x_n\left[\begin{matrix} — &a_n^T& — \end{matrix} \right]

2.3、矩阵乘法

基于以上的知识,矩阵乘法 C = A B C=AB 有4种表示方式

A的行,B的列: 最常用的方式

C = A B = [ a 1 T a 2 T a m T ] [ b 1 b 2 a p ] = [ a 1 T b 1 a 1 T b 1 a 1 T b 1 a 1 T b 1 a 1 T b 1 a 1 T b 1 a 1 T b 1 a 1 T b 1 a 1 T b 1 ] C=AB=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right] \left[\begin{matrix} |&|& &|\\b_{1}&b_{2}& \cdots &a_{p}\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\\a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\\ \vdots& \vdots&\ddots&\vdots\\a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\end{matrix} \right]

A的列,B的行:

C = A B = [ a 1 a 2 a p ] [ b 1 T b 2 T b n T ] = i = 1 n a i b i T C=AB= \left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{p}\\|&|& &|\end{matrix} \right] \left[\begin{matrix} — &b_1^T& — \\ — &b_2^T& — \\ &\vdots& \\ — &b_n^T& — \\ \end{matrix} \right]= \displaystyle \sum_{i=1}^na_{i}b_{i}^T

或者,可以看作是一系列的向量-矩阵乘积:
B以列向量表示:

C i = A b i C_i=Ab_i

C = A B = A [ b 1 b 2 b p ] = [ A b 1 A b 2 A b p ] C=AB= A\left[\begin{matrix} |&|& &|\\b_{1}&b_{2}& \cdots &b_{p}\\|&|& &|\end{matrix} \right] =\left[\begin{matrix} |&|& &|\\Ab_{1}&Ab_{2}& \cdots &Ab_{p}\\|&|& &|\end{matrix} \right]

A以行向量表示:

C i T = a i T B C_i^T=a_i^TB

C = A B = [ b 1 T b 2 T b n T ] B = [ a 1 T B a 2 T B a m T B ] C=AB=\left[\begin{matrix} — &b_1^T& — \\ — &b_2^T& — \\ &\vdots& \\ — &b_n^T& — \\ \end{matrix} \right]B=\left[\begin{matrix} — &a_1^TB& — \\ — &a_2^TB& — \\ &\vdots& \\ — &a_m^TB& — \\ \end{matrix} \right]

矩阵乘法的性质: (前面线性代数的本质更加形象)
·结合律 ( A B ) C = A ( B C ) (AB)C=A(BC)
·分配率 A ( B + C ) = A B + A C A(B+C)=AB+AC
·没有交换律!!

3、运算和性质

3.1、单位矩阵与对角矩阵

单位矩阵只有对角线位置是1,其余都是0的矩阵

I i j = { 1 i = j 0 i j I_{ij}=\left\{ \begin{matrix}1&i=j\\0& i \ne j \end{matrix} \right. (不等于号打出来有问题)

A I = A = I A AI=A=IA

对角矩阵只有对角不为零

D i j = { d i i = j 0 i j D_{ij}=\left\{ \begin{matrix}d_i&i=j\\0& i \ne j \end{matrix} \right.

3.2、转置

行列反转, A R m × n A \in \mathbb{R}^{m×n} 转置为 A T R n × m A^T \in \mathbb{R}^{n×m}

其元素为 ( A T ) i j = A j i (A^T)_{ij}=A_{ji}

性质: ( A T ) T = A (A^T)^T=A ( A B ) T = B T A T (AB)^T=B^TA^T ( A + B ) T = A T + B T (A+B)^T=A^T+B^T

3.3、对称矩阵

A R n × n A \in \mathbb{R}^{n×n} ,如果 A = A T A=A^T ,那就是对称的,如果 A = ( A T ) A=(-A^T) 那就是反对称的
任何矩阵A, A + A T A+A^T 是对称的, A A T A-A^T 是反对称的,因此

A = 1 2 ( A + A T ) + 1 2 ( A A T ) A=\frac{1}{2}(A+A^T)+\frac{1}{2}(A-A^T)

通常将大小为n的对称矩阵几何表示为 S n \mathbb {S}^n ,因此 A S n A\in\mathbb {S}^n 表示A是 n × n n×n 对称矩阵

3.4、迹

方阵 A R n A\in\mathbb {R}^n 的迹,记做 t r ( A ) tr(A) ,可以省略括号 t r A trA ,是矩阵的对角线元素之和:

t r A = i = 1 n A i i trA=\displaystyle \sum_{i=1}^nA_{ii}

性质如下:

A R n × n A \in \mathbb{R}^{n×n} t r A = t r A T trA=trA^T
A , B R n × n A ,B\in \mathbb{R}^{n×n} t r ( A + B ) = t r A + t r B tr(A+B)=trA+trB
A R n × n , t R A \in \mathbb{R}^{n×n} ,t \in \mathbb{R} t r ( t A ) = t t r A tr(tA)=t trA
A,B,C都是方阵, t r A B = t r B A trAB=trBA , t r A B C = t r B C A = t r C B A trABC=trBCA=trCBA ,方阵更多类推

3.5、范数

中间部分内容较多,后面再补上,

3.11、二次型和半正定矩阵

参见二次型的几何意义-知乎

发布了90 篇原创文章 · 获赞 3 · 访问量 4912

猜你喜欢

转载自blog.csdn.net/weixin_43329319/article/details/97364681
今日推荐