字符串String中tag提取 - 代码天地

字符串String中tag提取

其他 2018-08-11 13:26:37 阅读次数: 0

为了便于进行内容cat归属，需要对string中的tag进行提取，这个tag的含义就广了，指导思想：尽量多

research了一些tag提取的方法：
1. 说的最基础的当然是 TF-IDF算法，可惜不怎么适用；
2. 第一个想到支持一下本校的成果：pkusumsum，当然里面也是基于一些常用的算法，实际测试只能提取document级别的文本，csdn自动识别tag可能与这个有关，当然我觉得更可能的是直接匹配tag库；
3. textrank算法：大概看了一下思路，和pagerank一样，相连的词就有一次打分，不适用；
4. rake算法，应该是几个发明者的首字母简写，看一下源码，我擦，这尼玛也太简单了吧，就是stopword停用词切分，然后排序，好吧，那就这个吧

最后选用rake算法，然后对phrase二次切分，结合tag库的匹配，实现了一套粗暴的tag提取算法

这套算法限制：1.需要输入有意义的句子，否则tag提取很乱，比如twitter文本就不是很合适；
优点：简单粗暴，而且还可以基于tag库扩展

猜你喜欢

转载自blog.csdn.net/chijiaodaxie/article/details/77072811

字符串String中tag提取

提取字符串中的数字

提取字符串中数字、

CString字符串中数字的提取

hive中的字符串提取

Tag-字符串

linux 字符串string操作（截取、提取、长度计算等）

JavaScript中字符串String对象

006 Python中的字符串String

Java中的字符串String

String中的字符串拼接问题

Python中String字符串操作

java中String字符串==的疑问？

3.2.3 处理string中的字符串

Java 中 String字符串过滤

java中String字符串

c++中的string字符串

android提取字符串中为字母的字符

<LeetCode>125.Valid Palindrome 验证回文字符串 Tag：string

String 字符串

String字符串

字符串String

字符串（string）

String(字符串)

字符串(String)

String——字符串

字符串 String

String：字符串

string:字符串

字符串-string

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)