jieba之TF-IDF和TextRank提取关键词 - 代码天地

jieba之TF-IDF和TextRank提取关键词

其他 2020-01-14 18:19:34 阅读次数: 0

使用结巴提取关键词，有两种方法可以调用，1：TD-IDF；2：TextRank。

下面实现，利用结巴的analyse包进行对应的算法调用，实现关键词提取

import jieba.analyse
tfidf = jieba.analyse.extract_tags
textrank = jieba.analyse.textrank


text = "许多中产阶级家庭家长们都受过一定的教育，对于孩子学习生活会有全新的想法。" \
        "于是送孩子读国际学校走出国门留学的道路成为中产阶级的不二选。前几日圈圈总结了" \
        "北京上海各大国际学校的学费详情请戳。看完了上海国际学校的费用，不少家长称比北京便宜" \
        "多了，帝都果然是帝都。今天圈圈再为大家分析一下广州部分国际学校的学费，以帮助焦虑的家长" \
        "做出正确的选择。细数广州这些国际学校一年同样要花费十几万甚至几十万的费用，丝毫不逊于北京" \
        "上海。这样惊人的学费也让不少中产家庭望而却步，但是作为家长又总是想把最好的教育带给孩子。" \
        "那么您又是如何盘算孩子的教育支出呢面对这样庞大的教育消费数额您最想把钱花在哪儿。"


tfidf(text, topK=5)
['家长', '学校', '学费', '教育', '国际']


textrank(text, topK=5)
['国际', '学校', '教育', '孩子', '家长']

*MuYu*

发布了147 篇原创文章 · 获赞 24 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_36535820/article/details/103819894

jieba之TF-IDF和TextRank提取关键词

关键词提取(tf-idf与textRank)

python实现tf-idf和textrank提取中文关键词

关键词提取:TF-IDF

TF-IDF提取关键词

TF-IDF算法之关键词提取

自然语言处理：关键词提取（TF-IDF、Textrank）

【NLP】【三】jieba源码分析之关键字提取（TF-IDF/TextRank）

Python的jieba分词及TF-IDF和TextRank 算法提取关键字

关键词抽取算法介绍：TF-IDF和TextRank

Python TF-IDF 算法提取文本关键词

python 基于TF-IDF算法的关键词提取

TF-IDF关键词提取方法的学习

TF-IDF关键词提取步骤

TF-IDF 提取文本关键词

提取关键词--tf-idf算法讲解

TF-IDF关键词提取算法

TF-IDF方法提取文本关键词

自然语言处理之关键词提取TF-IDF

鬼吹灯文本挖掘1：jieba分词和CountVectorizer向量化鬼吹灯文本挖掘3：关键词提取和使用sklearn 计算TF-IDF矩阵

TF-IDF关键词抽取

关键词提取/关键字提取之TF-IDF算法

文本分析--关键词获取（jieba分词器，TF-IDF模型）

jieba关键词抽取(TF-IDF)与中文抽取式摘要

鬼吹灯文本挖掘3：关键词提取extract_tags和使用sklearn TfidfTransformer 计算TF-IDF矩阵鬼吹灯文本挖掘3：关键词提取和使用sklearn 计算TF-IDF矩阵

中文文本关键词抽取的三种方法（TF-IDF、TextRank、word2vec）

中文自然语言处理--jieba基于 TF-IDF 算法进行中文文本中的关键词提取

TF-IDF与余弦相似性的应用（一）：自动提取关键词

TF-IDF与余弦相似性的应用（一）：自动提取关键词（转）

自然语言处理——TF-IDF算法提取关键词

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)