网页去重算法
网页去重发生在网页下载后、索引建立前,典型的网页去重算法有SHINGLING、I-MATCH算法、Random Projection、SimHash算法以及SPOTSING算法
猜你喜欢
转载自towan.iteye.com/blog/2059403
今日推荐
周排行