给大家推荐WordPress开源的采集小工具

胖鼠采集

介绍胖鼠:

胖鼠采集(Fat Rat Collect) 是一款能够帮助你网站自动化的工具.自动采集,自动发布,省心省力,

胖鼠采集初始化配置例子有: 微信 简书 御龙在天 寻仙 心理咨询师 虎扑 直播8,

并支持爬取任意网站列表详情页面 如(今日头条, 腾讯新闻, 简书, 知乎 …)

  • 胖鼠采集是完全内嵌到wordpress插件里面,不需要脱离wordpress,
  • 不会安装其他任何第三方软件. 功能强大。相比其他插件. 胖鼠很有优势.
  • 胖鼠是使用 Html,Jquery语法 爬取和剔除数据. 比其他采集器, 更灵活,
  • 胖鼠软件的设计思想分三大块. ①爬虫模块, ②配置模块, ③数据模块
  • ①爬虫模块主要使用配置模块的各种特色配置来爬取数据.
  • ②配置模块为爬虫模块提供支持.
  • ③数据模块支撑胖鼠各种特色发布功能!

安装

  • 在wordpress插件里搜索 胖鼠采集 安装即可

  • 下载地址: https://wordpress.org/plugins/fat-rat-collect/
  • Github: https://github.com/fbtopcn/fatratcollect
  • QQ群: 454049736

好处

  • 自动任务: 可以自动采集文章, 也可以自动发布文章.
  • 手动执行: 自动时间没到? 咱们手动来.
  • 文章过滤: 再用不用担心爬取重复啦.
  • 站群: 定时发布,维护站群好帮手.
  • 导入数据: 一键导入,站群导入.
  • 导入数据: 爬回来的数据预览, 单数据发布.
  • DEBUG模式: 帮你调试配置规则.
  • 分页爬取: 爬取目标站历史文章.
  • 手动配置采集规则采集任何网站 : 只要你只会一点点Html JQery即可写规则。如果你会一点点Html Jquery。自己搞应该没一点毛病。
  • 例:你可以用爬虫盯着 某新闻网站的 热门新闻列表页 当出现热点事件,他们第一时间更新文章。我们自动定时爬虫就抓到了。

猜你喜欢

转载自www.cnblogs.com/fbtop/p/10243336.html