jieba之TF-IDF和TextRank提取关键词

使用结巴提取关键词,有两种方法可以调用,1:TD-IDF;2:TextRank。

下面实现,利用结巴的analyse包进行对应的算法调用,实现关键词提取

import jieba.analyse
tfidf = jieba.analyse.extract_tags
textrank = jieba.analyse.textrank


text = "许多中产阶级家庭家长们都受过一定的教育,对于孩子学习生活会有全新的想法。" \
        "于是送孩子读国际学校走出国门留学的道路成为中产阶级的不二选。前几日圈圈总结了" \
        "北京上海各大国际学校的学费详情请戳。看完了上海国际学校的费用,不少家长称比北京便宜" \
        "多了,帝都果然是帝都。今天圈圈再为大家分析一下广州部分国际学校的学费,以帮助焦虑的家长" \
        "做出正确的选择。细数广州这些国际学校一年同样要花费十几万甚至几十万的费用,丝毫不逊于北京" \
        "上海。这样惊人的学费也让不少中产家庭望而却步,但是作为家长又总是想把最好的教育带给孩子。" \
        "那么您又是如何盘算孩子的教育支出呢面对这样庞大的教育消费数额您最想把钱花在哪儿。"


tfidf(text, topK=5)
['家长', '学校', '学费', '教育', '国际']


textrank(text, topK=5)
['国际', '学校', '教育', '孩子', '家长']
发布了147 篇原创文章 · 获赞 24 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/qq_36535820/article/details/103819894