第九周周五计划&&周四总结

今天主要将提取地主题词入库以及重新对新闻分类。

测试了一下单纯使用主题词作为主题追踪依据不是很好,明天尝试使用特征值提取(主题词(名词实体))+摘要比对综合。但是目前还没想好是每篇新闻的都要追踪还是热点新闻的进行追踪,也就是对爬虫和响应这里不是搞得很清楚。

今天进度很小,自闭了。

猜你喜欢

转载自www.cnblogs.com/mm20/p/11816029.html