自然语言处理基础技术工具篇之Pyltp

版权声明:转载请注明出处,谢谢~~ https://blog.csdn.net/m0_37306360/article/details/85872844

更多实时更新的个人学习笔记分享,请关注:
知乎:https://www.zhihu.com/people/yuquanle/columns
微信订阅号:AI小白入门
ID: StudyForAI



pyltp简介


pyltp工具Demo

安装:pip install pyltp,前面说过通过这种方式安装一直不能成功

pyltp安装有点麻烦-.-,于是记录了window 10下的一种成功安装方法

1.首先,pip install pyltp安装报错:error: command ‘C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC\BIN\x86_amd64\cl.exe’ failed with exit status 2

2.然后,我选择使用python setup.py install安装

3.使用里面的预训练模型,需要先下载,然后指定相应目录

注意:ltp3.4.0 版本 SRL模型 pisrl.model在windows系统下不可用
下载这个:http://ospm9rsnd.bkt.clouddn.com/server/3.4.0/pisrl_win.model


1.分词

from pyltp import Segmentor
seg = Segmentor() #生成对象
seg.load("pyltp-model\ltp_data_v3.4.0\cws.model") #加载分词预训练模型
seg_words = seg.segment("我爱自然语言处理技术!")
print(" ".join(seg_words))
seg.release() #释放资源
我 爱 自然 语言 处理 技术 !

2.词性标注(对分好的词进行标注)

from pyltp import Postagger  
pos=Postagger()
#加载词性预训练模型
pos.load("pyltp-model\ltp_data_v3.4.0\pos.model")
words_pos=pos.postag(seg_words)
for k,v in zip(seg_words, words_pos):
    print(k+'\t'+v)
pos.release()
我	r
爱	v
自然	n
语言	n
处理	v
技术	n
!	wp

3.命名实体识别

from pyltp import NamedEntityRecognizer
ner = NamedEntityRecognizer()
#加载命名实体识别预训练模型
ner.load("pyltp-model\ltp_data_v3.4.0\ner.model")
netags=ner.recognize(seg_words,words_pos)
print(" ".join(netags))
ner.release()

4.依存句法分析

from pyltp import Parser
parser=Parser()
parser.load("pyltp-model\ltp_data_v3.4.0\parser.model")
arcs=parser.parse(seg_words,words_pos)
print([(arc.head,arc.relation) for arc in arcs])
parser.release()
[(2, 'SBV'), (0, 'HED'), (4, 'ATT'), (5, 'FOB'), (2, 'VOB'), (5, 'VOB'), (2, 'WP')]

5.语义角色标注

from pyltp import SementicRoleLabeller
labeller = SementicRoleLabeller()
labeller.load("pyltp-model\ltp_data_v3.4.0\pisrl_win.model")
roles = labeller.label(seg_words,words_pos,arcs)
for role in roles:
    print(role.index, "".join(
        ["%s:(%d,%d)" % (arg.name, arg.range.start, arg.range.end) for arg in role.arguments]))
1 A0:(0,0)A1:(2,5)
4 A1:(5,5)

猜你喜欢

转载自blog.csdn.net/m0_37306360/article/details/85872844