关于关键词抽取的一些思考

问1:关键词提取是怎么做的?
答1:1)topic主题词抽取(lda)、词位置信息的关键词抽取(KE)、标题中的词(title)、停用词
2)按照策略选择5个候选关键词:主题词+标题中的词;KE+标题中的词;主题词+KE;主题词
3)topic关键词抽取:分词、特征选择、主题词抽取
4)分词:直接使用微博的分词工具,调用接口
5)特征选择:卡方、互信息、特征停用词过滤


问2:关键词提取怎么用的?
答2:1)文章自动打标签
2)聚合阅读


问3:关键词提取定位
答3:属于非结构化数据进行结构化处理的一部分
发布了21 篇原创文章 · 获赞 37 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/zhixiongzhao/article/details/73527816