python计算相似矩阵 - 代码天地

python计算相似矩阵

其他 2018-06-11 14:17:21 阅读次数: 0

模糊数学课上完之后对使用python中的sklearn计算矩阵各个元素的相似度有了一些感悟。

首先需要强调的是python中对于矩阵的计算尽量不要在DataFrame中，效率非常低。应该使用numpy。

1 预处理

常用1:MinMaxScaler

from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics.pairwise import pairwise_distances
from sklearn.metrics.pairwise import cosine_similarity

>>> matrix= np.array([[ 1., -1.,  2.],
...                     [ 2.,  0.,  0.],
...                     [ 0.,  1., -1.]])
...

>>> min_max_scaler = preprocessing.MinMaxScaler()
>>> matrix_minmax = min_max_scaler.fit_transform(matrix)
>>> matrix_minmax
array([[ 0.5       ,  0.        ,  1.        ],
       [ 1.        ,  0.5       ,  0.33333333],
       [ 0.        ,  1.        ,  0.        ]])

常用2:StandardScaler
把上面的MinMaxScaler换成StandardScaler就ok。

其他方法这里都有写

2 计算相似度矩阵

计算相似度矩阵的方法有很多种，发现了sklearn中直接有通过计算余弦相似度得到相似度矩阵的方法
1 sklearn.metrics.pairwise.cosine_similarity
2 sklearn.metrics.pairwise.pairwise_distances

>>> from sklearn.metrics.pairwise import cosine_similarity
>>> from sklearn.metrics.pairwise import pairwise_distances

>>> a=[[1,3],[2,2]]
>>> cosine_similarity(a)
array([[ 1.        ,  0.89442719],
       [ 0.89442719,  1.        ]])

>>> pairwise_distances(a,metric="cosine")
array([[ 0.        ,  0.10557281],
       [ 0.10557281,  0.        ]])

pairwise_distances方法是 cosine_similarity减1后取绝对值得到的。

猜你喜欢

转载自blog.csdn.net/zhaohaibo_/article/details/80617174

python计算相似矩阵

【PyTorch】计算局部相似矩阵

理解相似矩阵

相似矩阵

相似矩阵、过渡矩阵

相似矩阵和等价矩阵

线性代数之——相似矩阵

线性代数系列：相似矩阵

计算机中的数学---相似矩阵及二次型

矩阵知识--相似矩阵，矩阵的迹，矩阵求导

#模糊相似矩阵到模糊等价矩阵（opencv实现）

特征值、特征向量、相似矩阵

保研复习——线性代数5：相似矩阵

29-相似矩阵和若尔当形

线性代数(四) 特征值&相似矩阵

正定矩阵，正交矩阵，对角化，可逆矩阵，奇异矩阵，相似矩阵

矩阵知识：线性变换、相似矩阵、对角矩阵、逆矩阵

线性代数系列：实对称矩阵的相似矩阵，矩阵相合

（五）【线性代数】特征值与特征向量|相似矩阵|实对称矩阵

特征值、特征向量、相似矩阵，矩阵对角化的意义

【Python进阶】Python计算consine相似性矩阵

现代复习——第5章相似矩阵及二次型

用相似矩阵的几何意义直观理解PCA降维方法

线性代数笔记30——相似矩阵和诺尔当型

线代--PART5 特征值、特征向量、相似矩阵

1-线性代数-相似矩阵及二次型(4)

AI理论知识基础（20）-线性变换（2），转换矩阵，相似矩阵，坐标向量

优化计算相似度矩阵

python工具方法 40 计算图像|矩阵间的余弦相似度

python simhash计算相似度

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)