java实现网络爬虫

用java实现网络爬虫已经有很多款开源的软件包。


WebCollector

爬虫简介

WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。


https://github.com/CrawlScript/WebCollector



java实现的爬虫开源软件包:
http://www.oschina.net/project/tag/64/spider

猜你喜欢

转载自ocean1208.iteye.com/blog/2204572
今日推荐