分布式爬虫管理平台 Crawlab v0.6.0 社区版正式发布

概览

作为一个重要版本发布,Crawlab v0.6.0 由一些重大的功能升级组成,包括性能、稳定性、健壮性、易用性方面的大量优化。本次版本将比老版本更加健壮,特别是任务执行、文件同步、节点通信上面。

新版本截图

主页

节点列表页

爬虫列表页

爬虫文件编辑

任务列表

任务日志

任务数据

创建定时任务

Git 日志

依赖安装

扫描二维码关注公众号,回复: 14165238 查看本文章

爬虫助手插件

自定义列表

更新日志

后端

  • 文件同步. 将文件同步从原先的 MongoDB GridFS 迁移到分布式文件系统 SeaweedFS,以提升文件同步和爬虫部署的稳定性和健壮性。

  • 节点通信. 将节点通信从原先基于 Redis 套壳的 RPC 迁移到 gRPC。工作节点通过向主节点发起 gRPC 请求来与 MongoDB 数据库间接交互。

  • 任务队列. 将任务队列从 Redis 列表迁移到 MongoDB 集合,以提高灵活性,例如优先级队列。

  • 日志. 将日志储存迁移到 SeaweedFS,以解决 MongoDB 数据库中的性能问题。

  • SDK 集成. 将结果数据储存从原生 SDK 迁移到了任务处理器集中导入到数据库。

  • 任务相关. 将任务相关逻辑抽象为了任务调度器、任务处理器以及任务执行器,以减少系统耦合度,提升可扩展性和可维护性。

  • 组件化. 引入依赖注入框架,将模块、服务以及子系统进行模块化。

  • 插件框架. Crawlab 插件框架 (CPF) 已发布. 详情请参考 这里.

  • Git 集成. Git 集成被作为内置功能.

  • Scrapy 集成. Scrapy 集成以插件形式存在,插件为 spider-assistant.

  • 依赖集成. Dependency 集成以插件形式存在,插件为 dependency.

  • 消息通知. 消息通知功能以插件形式存在,插件为 notification.

前端

  • Vue 3. 迁移到了最新的前端框架 Vue 3,以支持更高级的功能,例如组合式 API 和 TypeScript。

  • UI 框架. 从之前的 Vue-Element-Admin 迁移到了基于 Vue 3 的 UI 框架 Element-Plus,更多灵活性和功能性。

  • 高级文件编辑器. 支持更高级的文件编辑器功能,包括拖砖操作、复制、移动、重命名、删除、文件编辑、代码高亮、导航标签等。

  • 可自定义表格. 内置更多高级功能,包括自定义列、批量操作、搜索、过滤、排序等。

  • 导航标签. 支持多导航标签查看不同的页面。

  • 批量创建. 支持批量创建对象,包括爬虫、项目、定时任务等。

  • 详情导航. 详情页里的侧边栏导航。

  • 更优化的仪表盘. 主页仪表盘中更多的数据图表。

其他

  • 文档网站. 升级 文档网站.

  • 官方插件. 允许用户在 Crawlab 用户界面上安装 官方插件.

未来计划

作为 Crawlab v0.6.x 新版本系列的首发版本,后续将收集新版本的用户反馈,并且进一步优化既有功能以及开发新功能。欢迎大家来试用 Crawlab v0.6.0 社区版,提出您的宝贵意见。

关于旧版本

新版本 Crawlab v0.6.x 从底层架构方面做的根本性的更新,因此将不会兼容旧版本 Crawlab v0.5.x 及以下。如果您已经在使用旧版本,建议迁移少部分爬虫到新版本,做过充分测试之后再做全量迁移。

新版本发布并不意味着开发组将停止更新旧版本 Crawlab v0.5.x,我们将长期维护既有版本 Crawlab v0.5.x 版本系列直到新版本完全稳定以及旧版本用户已大部分迁移到新版本。

后续会提供迁移至新版本的相关文档,请随时关注微信交流社群、官方网站以及官方文档。

社区

如果您觉得 Crawlab 对您的日常开发或公司有帮助,欢迎在 Github 上进行 star,以及,如果遇到任何问题,请随时在 Github 上提 issue。另外,欢迎您对 Crawlab 做开发贡献。同时,您也可以加微信 tikazyq1 加入 Crawlab 技术交流群,在技术开发和部署使用上与其他开发者进行交流讨论。

参考

  • 官网: https://www.crawlab.cn

  • 文档: https://docs.crawlab.cn

  • GitHub: https://github.com/crawlab-team/crawlab

  • Demo: https://demo-pro.crawlab.cn/

猜你喜欢

转载自www.oschina.net/news/196953/crawlab-0-6-0-released