自然语言处理(python)环境配置-NLTK的安装

自然语言处理(python)环境配置-NLTK的安装

1.自然语言处理的介绍

NLP (Natural Language Processing) 是人工智能(AI)的一个子领域。是机器真正能够理解人类说话的重要一环。自然语言处理也不是新的研究领域,早在上个世纪就开始研究,但是给予计算机环境等等因素导致这方面的发展一直停滞不前,再机器学习,统计学,计算机科学的快速发展下,NLP又迎来了新的春天,在将来的发展中也是非常重要的一环。具体介绍可以参见百度百科等(https://baike.baidu.com/item/nlp/25220)。

2.自然语言处理语言工具

在自然语言处理中,python也成了当仁不让的语言了,这种包的继承,有如站在巨人的肩膀上前进,但是,这仅是对当前已技术的使用,对于深层次的研究确实是需要花费功夫的。特别是在硕士研究生、博士研究生等等都是是需要真正地去思考语言的形成,这里又乔姆斯基的形式语言学说,中国的自然语言处理大家冯远炜教授的著作都是我们值得去思考和借鉴的,在结合当前的统计学,机器学习,计算机科学的发展,自然语言处理在python这种好用的编程工具的基础上会发展的更好。

3.自然语言处理的第一步

当然,博主是想从事这方面研究的小白,才刚刚起步,希望这是一个记录自己成长的平台,也希望把自己知道的,学习中遇到的问题分享出来。这是开始学习,使用的是比较出名的nltk包,当然对于汉字的分词处理等,据博主知道的还有jieba分词等。
环境准备:
System:window 10
IDE:anaconda-spyder
环境配置:似乎anaconda中已经把nltk集成了,当然自己也可以在命令行中输入:pip install nltk(前提是读者已经把环境都配好了);之后就是打开IDE创建一个py文件

import nltk
nltk.download()

即可下载nltk的语料等资源
如图:
这里写图片描述
由于国内访问比较慢,所以需要下载的,博主已经下载好了:链接: https://pan.baidu.com/s/1WbNb-h9U8VKYQXSYZonbvQ 密码: dq4s
更多信息也可查看官网:http://www.nltk.org/

猜你喜欢

转载自blog.csdn.net/meiqi0538/article/details/79846707