Visión general
Debido a la epidemia, todo el mundo se queda en casa. Si es un recién graduado, es posible que esté un poco confundido acerca de cómo encontrar un trabajo. Por lo tanto, he obtenido información de reclutamiento de Internet para su uso.
Descripción del proyecto
Todo el proyecto sigue siendo muy simple, principalmente porque es más problemático obtener datos.En cuanto al proceso, consulte decenas de líneas de código para descargar fondos de pantalla de alta definición en lotes.
Parte del código
Esta vez solo lo dividí en dos partes.
1. Obtenga la lista de URL correspondiente a cada especialización en la página de inicio.
# 1.获取各个专业对应的url列表
index_data = requests.get(index_url, headers=headers).content.decode('gbk', 'ignore')
tree = etree.HTML(index_data)
second_data = tree.xpath(".//ul[@class='s_clear']/li/a/@href")[0:33]
major_name = tree.xpath(".//ul[@class='s_clear']/li/a/text()")[0:33]
major_url = []
for one_third_url in second_data:
x = str(one_third_url).split(".", 2)[1]
major_url.append(x)
2. Obtenga una lista de puestos en cada directorio
# 获取各个专业目录下的岗位
for i in range(len(major_url)):
print(major_url[i])
print(major_name[i])
major_job_page = requests.get(major_url[i], headers=headers).content.decode('gbk', 'ignore')
major_job_page_tree = etree.HTML(major_job_page)
job_list_title = major_job_page_tree.xpath(".//div[@class='hotJobList']/div/ul/li/a/text()")
job_list_url = major_job_page_tree.xpath(".//div[@class='hotJobList']/div/ul/li/a/@href")
job_list_date = major_job_page_tree.xpath(".//div[@class='hotJobList']/div/ul/li/span/text()")
Visualización de resultados