python3爬虫抓取智联招聘职位信息代码 - 代码天地

python3爬虫抓取智联招聘职位信息代码

其他 2018-08-07 22:50:02 阅读次数: 0

上代码，有问题欢迎留言指出。

# -*- coding: utf-8 -*-
"""
Created on Tue Aug  7 20:41:09 2018
@author: brave-man
blog: http://www.cnblogs.com/zrmw/
"""

import requests
from bs4 import BeautifulSoup
import json

def getDetails(url):
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Gecko/20100101 Firefox/6.0'}
    res = requests.get(url, headers = headers)
    res.encoding = 'utf-8'
    soup = BeautifulSoup(res.text, 'html.parser')
    soup = json.loads(str(soup))
    
    try:
        with open('jobDetails.txt', 'w') as f:
            print('创建 {} 文件成功'.format('jobDetails.txt'))
    except:
        print('failure')
    
    details = {}    
    for i in soup['data']['results']:
        jobName = i['jobName']
        salary = i['salary']
        company = i['company']['name']
        companyUrl = i['company']['url']
        positionURL = i['positionURL']
        details = {'jobName': jobName,
                   'salary': salary,
                   'company': company,
                   'companyUrl': companyUrl,
                   'positionURL': positionURL
                   }
#        print(details)
        toFile(details)

def toFile(d):
    dj = json.dumps(d)
    try:
        with open('jobDetails.txt', 'a') as f:
            f.write(dj)
#            print('sucessful')
    except:
        print('Error')

def main():
    url = 'https://fe-api.zhaopin.com/c/i/sou?pageSize=60&cityId=635&workExperience=-1&education=-1&companyType=-1&employmentType=-1&jobWelfareTag=-1&kw=python&kt=3&lastUrlQuery={"jl":"635","kw":"python","kt":"3"}'
    getDetails(url)

if __name__ == "__main__":
    main()

执行完上述代码后，会在代码同目录下创建一个保存职位信息的txt文件，jobDetails.txt。

这只是获取一页招聘信息的代码，后续会添加，如何获取url和所有页的招聘信息的代码。

智联招聘网站还是有一点点小坑的，就是不是所有的招聘职位详情页面都是使用智联的官网格式，点开某个招聘职位之后，链接定向到某公司官网的招聘网站上，后面遇到的时候会具体处理。

猜你喜欢

转载自www.cnblogs.com/zrmw/p/9439905.html

python3爬虫抓取智联招聘职位信息代码

python3 爬虫爬取智联招聘岗位信息

爬虫二：爬取智联招聘职位信息

Python+selenium爬取智联招聘的职位信息

Python爬虫抓取智联招聘（基础版）

用python抓取智联招聘信息并存入excel

python智联招聘爬虫

[Python爬虫]智联招聘

抓取智联招聘

pythton爬取智联招聘职位信息

给大家整理了一篇Python+selenium爬取智联招聘的职位信息

爬虫智联招聘

python3爬虫 -----爬取职位招聘信息-------from腾讯社会招聘

python爬虫——智联招聘（上）

python爬虫（一）---智联招聘实战

python爬虫 - 爬取智联招聘

python爬取智联招聘信息

（java）Jsoup爬虫学习--获取智联招聘（老网站）的全国java职位信息，爬取10页

Python3 scrapy爬取智联招聘存MongoDB

智联招聘爬虫--遥感招聘分析

Python爬虫爬取智联招聘（进阶版）

Python爬虫之-智联招聘网站

利用python分析2018智联招聘全国各个城市的职位数排名

python爬虫使用selenium爬取动态网页信息——以智联招聘网站为例

智联招聘爬虫源码分析(一)

爬虫-爬取智联招聘

python3爬虫-通过requests获取拉钩职位信息

用python爬取智联招聘

Python爬虫实战入门六：提高爬虫效率—并发爬取智联招聘

python爬虫集合 python爬虫入门一：爬虫基本原理 python爬虫入门三：requests库 python爬虫入门四：BeautifulSoup库(转) python爬虫入门六：Selenium库 python爬虫入门七：pymysql库 python爬虫入门八：多进程/多线程爬虫练习一：爬取睿奢图片爬虫练习二：爬取智联招聘职位信息爬虫练习三：爬取链家二手房信息爬虫练习四：爬取b站番剧字幕爬虫练习五：多进程爬取股市通股票数据爬虫练习六：爬取拉勾招聘信息爬虫小功能实现

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)