一、抓取详细的职位描述信息
详情页分析
Python学习资料或者需要代码、视频加Python学习群:960410445
在详情页中,比较重要的就是职位描述和工作地址这两个
由于在页面代码中岗位职责和任职要求是在一个 div 中的,所以在抓的时候就不太好分,后续需要把这个连体婴儿,分开分析。
爬虫用到的库
使用的库有:
- requests
- BeautifulSoup4
- pymongo
Python 代码
代码 easy,初学者都能看懂。
二、数据清洗
校正发布日期
校正薪水以数字保存
根据 工作经验年限 划分招聘等级