"Tag-TextRank：一种基于Tag的网页关键词抽取方法"分享总结 - 代码天地

"Tag-TextRank：一种基于Tag的网页关键词抽取方法"分享总结

企业开发 2018-05-30 14:43:32 阅读次数: 3

概述：

该方法在TextRank基础上，通过目标文档中的每个Tag引入相关文档来估计词项图的边权重并计算得到词项的重要度，最后将不同Tag下的词项权重计算结果进行融合.

主要贡献:

(1)  在一个大规模的Tag数据集上抽样分析了用户标注Tag的行为，发现Tag数据的关联特征。 
(2)  提出利用Tag 的关联文档信息来进行关键词抽取的框架，并给出一种实现方法Tag-TextRank。实验结果表明，Tag作为一种弱的指导信息，可以显著提高关键词抽取的精度。

Tag-TextRank算法的步骤：

1.根据要抽取的文档d中词的相邻关系，构建词项图G
2.对于d上的每一个Tag  t属于TT是文档d的Tag集合： 
2.1 找到相关文档集合D，相关文档是指与d共享相同Tag及用户的文档。在D上计算G中每条边<w1，w2>的权重即词项w1和w2的关联度
2.2 在 G上运行Pagerank获得节点的收敛值，输出词项重要度排序结果r
3.合并r,生成最终关键词列表

详情参见附件

猜你喜欢

转载自snv.iteye.com/blog/1886969

"Tag-TextRank：一种基于Tag的网页关键词抽取方法"分享总结

关键词抽取：pagerank，textrank

中文文本关键词抽取的三种方法（TF-IDF、TextRank、word2vec）

自然语言处理 | (10)基于TextRank的文本关键词抽取原理

关键词抽取方法

读《基于文档主题结构的关键词抽取方法研究》有感（一）

zblog tag页面关键词和描述单独调用的方法

关键词抽取模型得总结

Stable Diffusion 关键词tag语法教程

关键词抽取

关键词抽取算法介绍：TF-IDF和TextRank

从pagerank到textrank关键词提取

关键词提取算法TextRank

TextRank 关键词提取算法

TextRank做关键词提取

TextRank提取关键词实现原理

TextRank中文,英文关键词提取

【NLP】关键词提取：TFIDF、TextRank

基于TF-IDF算法抽取文章关键词

简单的抽取中文摘要及关键词的方法

关于关键词抽取的一些思考

TF-IDF算法（一种衡量关键词权重的算法）学习笔记

TF-IDF算法（一种衡量关键词权重的算法）学习笔记

（第一个java爬虫）java爬取网页文本并抽取中英文关键词

[NLP技术]关键词提取算法-TextRank

关键词提取(tf-idf与textRank)

短文本关键词提取算法RAKE & TextRank及改进

TextRank算法提取关键词的Java实现

pandas处理数据textrank提取关键词

textrank4zh获取关键词和摘要

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)