一、什么是gensim
gensim是一个python的科学库,gensim包含了TF-IDF、随机投影、word2vec和document2vec算法的实现,分层Dirchlet过程(HDP),潜在语义分析(LSA)和潜在Dirichlet分配(LDA),包括分布式并行版本。主要是用来主题建模、文档索引以及使用大规模语料数据的相似性检索,被作者称为“根据纯文本进行监督性建模最健壮、最有效的、最让人放心的软件”。
二、安装
gensim可以安装在Windows、Linux和Mac OS以及其他的平台,但是它需要依赖python和numpy以及scipy,如下图
1、安装numpy
pipenv install numpy
2、安装scipy
pipenv install scipy
3、安装gensim
pipenv install gensim
4、验证是否安装成功
扫描二维码关注公众号,回复:
2155513 查看本文章