抓取腾讯招聘python岗位 - 代码天地

抓取腾讯招聘python岗位

其他 2019-12-23 20:34:09 阅读次数: 0

# -*- coding: utf-8 -*-
"""
@author: Dell Created on Mon Dec 23 17:55:06 2019
"""
import re
import time
import requests
from lxml import etree

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By


HEADERS = {
    # 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36',
    'Referer': 'https://careers.tencent.com/',
    'Accept': 'application/json, text/javascript, */*; q=0.01'
}

def parse(url):
    driver= webdriver.Chrome()
    driver.get(url)
    text = driver.page_source
    
    # resp = requests.get(url, headers=HEADERS)
    # text = resp.content.decode("utf-8", errors="ignore")
    
    #解析网页
    html = etree.HTML(text)
    divs = html.xpath("//div[@class='recruit-list']")
    
    pos_infos = []
    for div in divs:
        title = div.xpath("./a/h4/text()")[0]#提取职位名称
        address = div.xpath("./a/p/span[2]/text()")[0]#提取职位工作地点
        require = div.xpath("./a/p[@class='recruit-text']/text()")[0]#提取职位要求
       
        pos_info = {'title':title, 'address':address, 'require':require}
        pos_infos.append(pos_info)
    
    driver.close()
    return pos_infos

def save(list):
    with open("tencent.txt", "a+", encoding="utf-8") as f:
        for line in list:
            f.write(str(line) + "\n")
            
    

if __name__ == "__main__":
    baseurl = "https://careers.tencent.com/search.html?index={}&keyword=python"
    for i in range(1,70):
        url = baseurl.format(i)
        pos_list = parse(url)
        
        save(pos_list)
        for pos in pos_list:
            print(pos)
        print("第%s页解析完成" % str(i), "-" * 50)
    pass

猜你喜欢

转载自www.cnblogs.com/zxfei/p/12088112.html

抓取腾讯招聘python岗位

爬虫练习1:爬取腾讯招聘python 岗位

转——Python爬虫抓取大数据岗位招聘信息（51job为例）

Python爬虫案例50篇-第8篇- 抓取某讯招聘的北京工作岗位

python抓取招聘信息

Python爬虫-爬取腾讯QQ招聘岗位信息（Beautiful Soup）

用python爬取腾讯招聘网岗位信息保存到表格，并做成简单可视化。（附源码）

使用线程方式对腾讯招聘进行数据抓取

Spider学习笔记（三）:抓取51招聘岗位信息

Python爬虫某招聘网站的岗位信息

python分析BOSS直聘的某个招聘岗位数据

python爬虫3——爬取腾讯招聘全部招聘信息

python实现腾讯招聘爬取

python爬取腾讯招聘的职位

python 爬虫 scrapy 爬取腾讯招聘

岗位推荐 | 腾讯招聘自然语言处理方向实习生

岗位推荐 | 腾讯AI Lab招聘计算机视觉方向实习生

Scrapy框架学习练手之爬取腾讯招聘技术类岗位

腾讯招聘

python3 + scrapy 抓取boss直聘岗位

手把手带你抓取智联招聘的“数据分析师”岗位！

Python爬虫抓取智联招聘（基础版）

用python抓取智联招聘信息并存入excel

python 抓取拉钩招聘信息并且存入mongodb。

BeautifulSoup4：抓取腾讯社招页面的招聘信息

抓取智联招聘

大数据岗位招聘需求

2020阿里招聘岗位要求

1000+岗位！华为招聘！

聊聊腾讯的岗位级别

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)