snownlp文本分词、情感分析、文本相似度与摘要生成

其他 2021-03-21 08:38:59 阅读次数: 0

使用的库是snownlp库，github项目地址：https://github.com/isnowfy/snownlp

文章目录

安装
使用方法

安装

pip安装：pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ snownlp

使用方法

除了官方的使用案例，其他常用的操作都在下面有所总结

from snownlp import SnowNLP

s = SnowNLP(
    '自然语言处理（英语：Natural Language Processing，缩写作 NLP）是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言；自然语言处理包括多方面和步骤，基本有认知、理解、生成等部分。')
print(s.words)  # 分词：['自然', '语言', '处理', '（', '英语'...
print(list(s.tags))  # 词性标注： ('自然', 'n'), ('语言', 'n'), ('处理', 'v')...
print(s.sentiments)  # 情感分析： 0.9999997920922455 大于0.4为积极，否则为消极
print(s.pinyin)  # 拼音：['Zi', 'ran', 'yu', 'yan', 'chu'...
print(s.keywords(3))  # 关键词：['语言', '自然', '领域']
print(s.summary(3))  # 摘要/文本概括：'自然语言处理包括多方面和步骤', '此领域探讨如何处理及运用自然语言', '自然语言处理（英语：Natural Language Processing']
print(s.sim([u'文章']))  # 词的相似度[0,0,0...

s2 = SnowNLP([  # 若要计算TF IDF值，注意传入数据格式为 list to list 格式
    s.words
])
print(s2.tf)  # TF值： [{'自然': 3, '语言': 4, '处理': 3...
print(s2.idf)
print(SnowNLP('自然語言處理').han)  # 繁体转简体

注：停用词表位置：/snownlp/snownlp/normal/stopwords.txt

猜你喜欢

转载自blog.csdn.net/weixin_35757704/article/details/114530706

snownlp文本分词、情感分析、文本相似度与摘要生成

python 文本分词+文本相似度分析

文本相似度分析

文本相似度表示与分词

【数据分析学习笔记day26】自然语言处理NLTKPython文本分析工具NLTK 情感分析+ 文本相似度 +文本分类 +分类预测模型+朴素贝叶斯+ 实战案例+微博情感分析

文本相似度

利用word分词来计算文本相似度

（NLP）基于分词标签的中文短文本相似度

gensim和jieba分词进行主题分析，文本相似度

文本相似度算法

浅析文本相似度

关于文本相似度

文本相似度推荐

NLP文本相似度

Python案例分析｜文本相似度比较分析

基于word分词提供的文本相似度算法来实现通用的网页相似度检测

文本相似度计算——HanLP分词+余弦相似度算法

Python文本分析（NLTK,jieba,snownlp）

文本相似度-相似度度量

使用BERT做中文文本相似度计算与文本分类

用Python进行简单的文本相似度分析（重要）

Python 文本相似度分析（小白进）

基于CNN和词向量的文本相似度分析

python 文本相似度分析doc2bow

项目：文本相似度分析（C++）

python文本相似度分析tf-idf

Python实现简单的文本相似度分析

文本相似度比较分析（Python案例研究九）

python文本相似度分析：TF-IDF方法

【数据分析学习笔记day30】自然语言处理NLTK+文本相似度和分类 +文本相似度案例+文本分类+ TF-IDF +（词频-逆文档频率）+ 案例

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)