gensim的LSI模型来计算文档的相似度 - 代码天地

gensim的LSI模型来计算文档的相似度

其他 2018-05-07 15:38:51 阅读次数: 3

[python]view plaincopy 
    
 from gensim import corpora,models,similarities  
 dictionary=corpora.Dictionary.load('/tmp/deerwester.dict')  
 corpus=corpora.MmCorpus('/tmp/deerwester.mm')  
 print(corpus)  
   
 lsi=models.LsiModel(corpus,id2word=dictionary,num_topics=2)  
 doc="human computer interaction"  
 vec_bow=dictionary.doc2bow(doc.lower().split())  
 vec_lsi=lsi[vec_bow]  #convert the query to LSI space  
 print(vec_lsi)  
   
 #transform corpus to space and index it  
 index=similarities.MatrixSimilarity(lsi[corpus])  
   
 index.save('/tmp/deerwester.index')  
 sims=index[vec_lsi]  
 sims=sorted(enumerate(sims),key=lambda item:-item[1])  
   
 from pprint import pprint  
 pprint(sims)  

利用gensim的LSI模型计算文档的相似度

猜你喜欢

转载自blog.csdn.net/tiryzheng/article/details/48573767

gensim的LSI模型来计算文档的相似度

lsi计算文档相似度

使用Gensim建立bow TFIDF LSI模型对文本相似度计算

gensim计算文档相似度

Gensim用LDA模型计算文档相似度

基于gensim包的潜在语义索引（LSI）模型的相似度查询

gensim计算余弦相似度采坑

gensim基于lsa算法的文章相似度计算

句子相似度计算模型

jieba gensim 相似度实现

NLP训练一个可以寻找相似度最匹配的句子的模型（LSI、LDA、TFIDF）

使用spark计算文档相似度

动手实践用LDA模型计算两篇英文文档相似度

gensim文档-相似性查询

Python 文本挖掘:使用gensim进行文本相似度计算

利用python及jieba分词和gensim模块计算文本相似度

机器学习算法Python实现：gensim里的similarities文本相似度计算

gensim中doc2vec计算文本相似度

用gensim doc2vec计算文本相似度，Python可以跑通的代码

利用word分词来计算文本相似度

用户相似度计算

相似度计算

pandas相似度计算

余弦相似度计算

图像相似度计算

句子相似度的计算

文章相似度计算

距离与相似度计算

相似度计算之余弦相似度

使用jieba和gensim模块判断文本相似度

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)