谷尼GoonieFilter网站内容敏感词过滤系统

GoonieFilter网站内容敏感词过滤系统

GoonieFilter网站内容敏感词过滤系统是一套基于多智能主体技术的网站内容敏感词过滤系统,引入了多个主体来实现敏感信息过滤功能,通过多主体的协作,可以有效的对网站敏感信息的采集、处理和监控,以计算机智能处理技术辅助信息汇集整理和分析,最后去伪存真,实现网站敏感信息过滤。

GoonieFilter敏感词过滤系统适用于网站新闻、博客、论坛等结构化和非结化内容的敏感词过滤。

敏感词过滤其内容类型主要包括:

(l)反对宪法所规定的基本原则的信息;

(2)危‘’害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益的信息;

(3)煽‘’动民族仇‘’恨、民族歧‘’视、破‘’坏民族团结的信息;

(4)破坏国家宗教政策,宣扬邪‘’教和封‘’建迷‘’信的信息;

(5)散布谣言,扰乱社会秩序,破坏社会稳定的信息;

(6)散布淫‘’秽、色‘’情、赌‘’博、暴‘’力、凶‘’杀、恐‘’怖或者教唆犯‘’罪的信息;

(7)侮‘’辱或诽‘’谤他人,泄‘’漏或传播他人隐‘’私,侵‘’害他人合法权益的信息;

(8)崇‘’物、厌‘’世等违反道德的不雅信息。

网站敏感信息监控方法的不同主要体现在敏感信息过滤方法的不同。有关网站敏感信息的过滤方法很多,从过滤系统结构来看,可以分为基于内容的过滤和协作过滤两种:

(1)基于内容过滤方法:按照信息内容的特征做出选择,主要采用自然语言处理、人工智能、概率统计等技术监测现有信息的内容特征。

(2)协作过滤方法:是“相似”用户间的相互协作过程,用户的知识、职业、兴趣爱好以及思想观念对于信息过滤很重要。 

谷尼:http://www.goonie.cn/

猜你喜欢

转载自nassir.iteye.com/blog/1661008
今日推荐