序文:
自然言語処理の学習では、他の人が訓練したモデルを使用することも、自分で訓練したモデルを使用することもできます。この記事では、gensimに付属するいくつかの方法を使用して、モデルモデルをロードし、モデルの成功を検証します。
コード:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#测试训练好的模型
import warnings
warnings.filterwarnings(action='ignore', category=UserWarning, module='gensim')# 忽略警告
import importlib,sys
importlib.reload(sys)
import gensim
'''@liyang测试model是否可用'''
def word2vec_model_match():
fdir = r'F:/model/'
model = gensim.models.Word2Vec.load(fdir + 'wiki.zh.text.model')
# 与该词相似的词的前10个
word = model.most_similar(u"加油")
for t in word:
print(t[0], t[1])
# 有那个是不匹配的
print(model.doesnt_match(u'不 听 老师 辅导员 指导'.split()))
# 与positive相似与negative不相似
word = model.most_similar(positive=[u'高兴', u'伤心'], negative=[u'手机']) #
for t in word:
print(t[0], t[1])
# 输出两词相似度
print(model.similarity(u'加油', u'奋发'))
# 输出某个词的特征向量
print(model[u'工作人员']) # 输出了多少个向量就是多少维
if __name__ == '__main__':
word2vec_model_match()
注:リリースされたコードはすべてpython3.5バージョンで有効です。ご不明な点がございましたら、メッセージを残して返信してください。