51job招聘爬虫&数据分析 - 代码天地

51job招聘爬虫&数据分析

其他 2019-04-14 17:21:12 阅读次数: 0

招聘爬虫+数据分析 1.爬虫：采用Scrapy 分布式爬虫技术，使用mongodb作为数据存储，爬取的网站Demo为51job，数据我目前爬了有几千条 2.数据处理：采用pandas对爬取的数据进行清晰和处理 2.数据分析：采用flask后端获取mongodb数据，前端使用bootstrap3.echarts以及D3的词云图

###注意：1. pymongo安装版本 <=3.0 建议 pip install pymongo==2.8### 2. 如果scrapy安装不上，在这上面查找https://www.lfd.uci.edu/~gohlke/pythonlibs/ 先安装对应版本 twisted ，再安装scrapy就没问题。 3.mongodb启动，进入安装mongodb的文件夹的bin目录下面，输入 mongod --dbpath= data文件夹路径

关于项目启动

爬虫：

1.cd 目录 2. pip install pymongo==2.8 3. scrapy crawl zlzp
数据可视化
1. 激活虚拟环境 cd venv/Scripts activate
2. python zlzpView.py

项目源码：https://github.com/Frank-qlu/recruit

扫描二维码关注公众号，回复： 5887048 查看本文章

猜你喜欢

转载自blog.csdn.net/qq_36114862/article/details/88825673

51job招聘爬虫&数据分析

爬虫_抓取51job招聘数据

招聘信息数据分析及可视化|以51JOB为例进行

招聘信息数据分析|以51JOB为例进行

Selenium获取51job招聘数据

51job爬虫

基于Python的前程无忧、51job、智联招聘等招聘网站数据获取及数据分析可视化大全【代码+演示】

Python爬虫爬取51job招聘网站

转——Python爬虫抓取大数据岗位招聘信息（51job为例）

Python爬虫之51job招聘数据信息爬取实战

简单使用requests_html模块爬取51Job招聘网的招聘数据

python爬虫之XPath（爬取51job招聘信息）

selenium对51job进行职位爬虫

爬取51job招聘网

使用webmagic爬取51job网站的招聘信息

java 爬取51job招聘信息

使用WebMagic爬取51job上的招聘信息

爬虫项目实战：51job抓取--scrapy版存于数据库

爬虫实战-使用Springboot+WebMagic爬取51job数据

Python3 爬取51job的数据存入MongoDB并分析

【51Job数据爬取日志】前程无忧URL请求字段分析

爬虫-招聘系列1----51Job

Python3.6爬虫集合 xpath bs4 re 爬51job前程无忧招聘信息豆瓣音乐等等

使用beautifulsoup方法抓取51job网页数据

用scrapy异步写入，爬取51job数据

简单的51job数据可视化

Java 爬取 51job 数据 WebMagic实现

51job词云

scrapy同时爬取51job和智联招聘

51job（前程无忧官网）1万条招聘信息的爬取

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)