线性代数一(向量)

一 . p范数
向量的长度,也叫向量的范数,p范数定义了距离,kmeans 长度的扩展:(a**p+b**p+c**p)**(1/p)

二. 向量a和向量b的内积(点积)
a·b = a1*b1+a2*b2+a3*b3=|a|*|b|cosq
物理意义:点积反映了2个向量共振的程度

三. 向量的投影
Proj.u = (u·v)/|v|
物理意义:向量u在向量v上的投影
这里写图片描述

四.cos相似度的计算公式:cosq = (u·v) / (|u|*|v|)
cosq的值越大,表明相似度越大。
两个向量的cos相似度越大,两个向量就越相似
这里写图片描述
这里写图片描述
cos相似度的问题:当用户的评分尺度不一样时,就无法正确反映有用的信息,这就想到Pearson相似度

五. Pearson相似度
又叫Pearson相关系数,correlation coefficient
这里写图片描述

Pearson相似度的计算步骤:
1. 中心化
2. 计算cos相似度

Pearson相似度在线性变换下,保持不变

线性相关和线性独立的定义
这里写图片描述

结论:只有n个独立向量,才能张成一个n维的向量空间。

六. 向量组的秩rank:向量组所含的最大数目的独立向量。
应用:
逻辑回归,线性回归,特征的选取,去除冗余的特征

猜你喜欢

转载自blog.csdn.net/qq_42379006/article/details/80647641