python文章推荐系统(项目源码+word+视频讲解)

目录

一,项目介绍

二,项目制作原理

三,项目功能

(1)登录模块

 (2)文章选择页

 (3)文章阅读

(4) 查看关键字

(5)搜索文章相识度

三,项目源码


一,项目介绍

         本项目是使用python+Tkiner组件库写的文章推荐系统,

(1)首先利用爬虫爬取新闻文章,然后保存到本地,在将爬取的数据保存都本地的myslq数据库中

(2)读取本地文章的内容,在可视化工具上显示,有三个功能分别为:查看文章内容,查看关键字,搜索与该文章类似的文章,显示文章相识度。

二,项目制作原理

        本项目通过puthon代码,从新闻网站上爬取相关数据内容保存进文本当中,并对本文里面的内容进行去除空格与去除html标签等优化处理,再将文本内容存进数据库当中。

        在将文本里面的内容进行去除数字与英文符号转为小写的处理后,采用jieba库的FMM正向最大匹配算法找到关键词,对分词结果进行词频统计进行排序,且关键字若在停用词中就不参与词频的统计,最后再判断关键词词频是否大于用户自定义的词频数,若是大于就删除更改关键字。

        在将每次文章的前n个词频度作为文章的关键字后,对所有文章的关键字都进行n维度向量,并根据向量以一个文章为模板计算文章相似度,最后利用冒泡排序将文章相似度从大到小排列。

三,项目功能

(1)登录模块

 (2)文章选择页

 (3)文章阅读

 

(4) 查看关键字

(5)搜索文章相识度

三,项目源码

        项目源码我放在了评论区里

猜你喜欢

转载自blog.csdn.net/weixin_54691198/article/details/128487183