jieba和snownlp分词的对比及snownlp用法简介和情感分析 - 代码天地

jieba和snownlp分词的对比及snownlp用法简介和情感分析

企业开发 2018-08-15 05:18:35 阅读次数: 0

首先安装jieba和snownlp直接pip就可以。

import jieba
from snownlp import SnowNLP
#SnowNLP库:
# words：分词
# tags：关键词
# sentiments：情感度
# pinyin：拼音
# keywords(limit)：关键词
# summary：关键句子
# sentences：语序
# tf：tf值
# idf：idf值

#分词的对比
s=SnowNLP('这个东西很赞')
#s.words返回一个列表，打印出来即可
print(s.words)
['这个', '东西', '很', '赞']

#jieba.cut返回一个生成器
print(list(jieba.cut('这个东西很赞')))
['这个', '东西', '很赞']

#拼音真的牛
print(s.pinyin)

['zhe', 'ge', 'dong', 'xi', 'hen', 'zan']

#关键词tags
print(list(s.tags))
[('这个', 'r'), ('东西', 'n'), ('很', 'd'), ('赞', 'Vg')]

#关键词的对比

text = '''
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。
它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
自然语言处理是一门融语言学、计算机科学、数学于一体的科学。
因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，
所以它与语言学的研究有着密切的联系，但又有重要的区别。
自然语言处理并不是一般地研究自然语言，
而在于研制能有效地实现自然语言通信的计算机系统，
特别是其中的软件系统。因而它是计算机科学的一部分。
'''
s=SnowNLP(text)
#s.tags 返回一个列表
print(list(s.keywords(5)))
['语言', '自然', '计算机', '领域', '研究']

#jieba.analyse返回一个列表
print(jieba.analyse.extract_tags(text,topK=5))
['自然语言', '计算机科学', '语言学', '研究', '领域']

我个人还是认为jieba分词要比snownlp分词好点，但是snownlp可以挑选关键句子和做情感分析。

#情感分析
print(s.sentiments)

1.0

#关键句子
print(s.summary())
['因而它是计算机科学的一部分', '自然语言处理是计算机科学领域与人工智能领域中的一个重要方向', '自然语言处理是一门融语言学、计算机科学、数学于一体的科学', '所以它与语言学的研究有着密切的联系', '这一领域的研究将涉及自然语言']

猜你喜欢

转载自blog.csdn.net/ustbclearwang/article/details/81669041

jieba和snownlp分词的对比及snownlp用法简介和情感分析

python情感分析：基于jieba的分词及snownlp的情感分析！

情感分析——深入snownlp原理和实践

Python分词、情感分析工具——SnowNLP

jiagu、snownlp、jieba对比

情感分析-SnowNLP

情感分析方法之snownlp和贝叶斯分类器（三）

中文分词工具简介与安装教程（jieba、nlpir、hanlp、pkuseg、foolnltk、snownlp、thulac）

Python文本分析（NLTK,jieba,snownlp）

python snownlp情感分析简易demo(分享)

谈一下SnowNLP的情感分析

基于结巴分词、SnowNLP、Kmeans自然语言处理之京东评论情感分析

snownlp文本分词、情感分析、文本相似度与摘要生成

Snownlp

情感分析snownlp包部分核心代码理解

【python 走进NLP】利用SnowNLP 训练自己的情感分析库

利用SnowNLP对淘宝评论进行简单的情感分析

Python - 中文文本情感分析（基于snownlp ）

中文情感分析——snownlp类库源码注释及使用

python 中文情感分析 Snownlp库的使用

常用中文分词工具分词&词性标注简单应用（jieba、pyhanlp、pkuseg、foolnltk、thulac、snownlp、nlpir）

python︱六款中文分词模块尝试:jieba、THULAC、SnowNLP、pynlpir、CoreNLP、pyLTP

六款中文分词模块尝试:jieba、THULAC、SnowNLP、pynlpir、CoreNLP、pyLTP

五款中文分词工具在线PK: Jieba, SnowNLP, PkuSeg, THULAC, HanLP

中文分词模型-pkuseg和jieba对比

分词jieba和LAC的对比使用记录

jieba分词的基本用法和词性标注

python的中文文本挖掘库snownlp进行购物评论文本情感分析实例

snownlp中文情感分析[正负面sentiments/相似度sim]

Python - 微信好友个性签名情感分析（基于Python开源库snownlp ）

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)