Selenium+Python自动化测试爬取51job数据。

根据条件查询到的job数据保存在Excel表中。

使用到的模块:selenium的webdriver、xlwt的workbook和time的sleep。

from selenium import webdriver
import time
import xlwt

browser = webdriver.Chrome()

url = "https://www.51job.com/"
browser.get(url)
browser.maximize_window()
browser.implicitly_wait(10)

find_messge = "软件测试工程师"

browser.find_element_by_id("kwdselectid").send_keys(find_messge)
browser.find_element_by_xpath("/html/body/div[3]/div/div[1]/div/button").click()

city_select = browser.find_element_by_id("work_position_input")
city_select.click()

time.sleep(5)
sel_citys = browser.find_elements_by_css_selector('#work_position_click_center_right_list_000000 em[class=on]')
for sel_city in sel_citys:
    sel_city.click()

# 选择成都
browser.find_element_by_id("work_position_click_center_right_list_category_000000_090200").click()

# 确定
browser.find_element_by_id("work_position_click_bottom_save").click()

# 搜索
browser.find_element_by_class_name("p_but").click()

# 工作列表
jobs = browser.find_elements_by_css_selector("#resultList div[class=el]")

# 新建一个数据表
book = xlwt.Workbook()

# 新建一个sheet
sh = book.add_sheet("统计")

# 写入内容
row = 0
for job in jobs:
    fields = job.find_elements_by_tag_name("span")
    col = 0
    for field in fields:
        text = field.text
        print(text, end="")
        sh.write(row, col, text)
        col += 1
    print("")
    row += 1

# 保存文件
book.save("D:\学习笔记\Pycharm_Code\Selenium_Test\Practice_Test\\51job.xls")
# 关闭
browser.quit()
发布了13 篇原创文章 · 获赞 14 · 访问量 916

猜你喜欢

转载自blog.csdn.net/qq_39979646/article/details/103737913