数据挖掘之自然语言处理

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_32146369/article/details/89054212

NLTK是python上著名的自然语言处理库,自带语料库、词性分类库、自带分类、分词等等功能。

安装语料库import nlk  

nlk.download()

文本处理流程

最后从文本转换为一组数字,这些数字就隐含了文本的意义。

stopwords:对于注重理解文本意思的应用场景来说歧义太多,所以要去掉。

NLTK在NLP上的经典应用有情感分析、文本相似度、文本分类。

猜你喜欢

转载自blog.csdn.net/qq_32146369/article/details/89054212
今日推荐