考研大数据爬取与分析工具3.0开发文档

1. 工具功能说明

  • 考研大数据爬取与分析工具(主要爬取与分析研招网( https://yz.chsi.com.cn/ )上的所有与招生有关的网页)

2. 代码设计说明

2.1. spider

  • 采集器模块
  • 为采集网页数据提供支持

2.2. selector

  • 筛选器模块
  • 为对采集到的数据进行筛选/过滤提供支持

2.3. analyser

  • 分析器模块
  • 为数据分析提供支持

2.4. storer

  • 存储器模块
  • 为存储与读取数据提供支持

2.5. main-01-getData

  • 程序入口模块
  • 为打开/启动程序以及调用执行相关库函数提供支持
  • 具体的,启动后开始进行第一阶段的数据采集工作

2.6. main-02-analyzeData

  • 程序入口模块
  • 为打开/启动程序以及调用执行相关库函数提供支持
  • 具体的,启动后开始进行第二阶段的数据分析工作

2.7. design pattern

  • 设计模式模块
  • 为类的设计模式(如单例模式)提供支持!
  • 具体的,我们暂时提供了单例模式的装饰器与仅添加添加获取单例方法的装饰器(未重新new方法)

2.8. multiple

  • 加速模块模块
  • 暂时提供多进程加速(注意在使用多进程进行异步运行时不能运行采用单例模式设计的类的方法)

2.9. 图解

在这里插入图片描述

3. 开源仓库

GitHub
码云
在这里插入图片描述

发布了605 篇原创文章 · 获赞 637 · 访问量 140万+

猜你喜欢

转载自blog.csdn.net/COCO56/article/details/104125435
今日推荐