一、首先,关于安装:
pip install nltk
二、接着,安装完之后,按着教程敲出一段代码运行,例如:
#coding:utf-8 import nltk text = 'hello,world.' # text = '你好,世界' sens = nltk.sent_tokenize(text) words = [] for sent in sens: words.append(nltk.word_tokenize(sent)) print words tags = [] for tokens in words: tags.append(nltk.pos_tag(tokens)) print tags
有可能会出现以下问题:
什么意思呢?是指,你缺少这个叫wordnet的东西。
解决方法:
下载完即可使用