用java实现网络爬虫已经有很多款开源的软件包。
WebCollector
爬虫简介
WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。
https://github.com/CrawlScript/WebCollector
java实现的爬虫开源软件包:
http://www.oschina.net/project/tag/64/spider
java实现网络爬虫
猜你喜欢
转载自ocean1208.iteye.com/blog/2204572
今日推荐
周排行