一个简单Python爬虫实例（爬取的是前程无忧网的部分招聘信息） - 代码天地

一个简单Python爬虫实例（爬取的是前程无忧网的部分招聘信息）

其他 2018-11-24 18:10:13 阅读次数: 0

从今天开始学习爬虫，展示我的第一个实例（用的是Python3写的，Python2需要加个编码方式吧，或许还有其他的不兼容的地方吧，我就不知道了），把这分享给大家，希望对大家有一些帮助

import urllib,re
import urllib.request
import xlwt
#打开网页，获取源码

def get_content():
url='https://search.51job.com/list/170200,000000,0000,00,9,99,Python,2,1.html?lang=c&stype=&postchannel=0000&workyear=99&cotype=99&degreefrom=99&jobterm=99&companysize=99&providesalary=99&lonlat=0%2C0&radius=-1&ord_field=0&confirmdate=9&fromType=&dibiaoid=0&address=&line=&specialarea=00&from=&welfare='
a=urllib.request.urlopen(url)#打开网站
html=a.read()
html=html.decode('gbk')#解码
print(html)
return html
#从源码中获取数据
def get():
html=get_content()
reg=re.compile(r'class="t1 ".*?<a target="_blank" title="(.*?)".*?<span class="t2"><a target="_blank" title="(.*?)".*? <span class="t3">(.*?)</span>.*? <span class="t4">(.*?)</span>.*? <span class="t5">(.*?)</span>',re.S)#提高效率
items=re.findall(reg,html)
print(items)
return items
#创建Excel表格
def excel_write(items):
newTable='test.xls'
wb=xlwt.Workbook(encoding='utf-8')#创建表格
ws=wb.add_sheet('test1')
headData=['招聘职位','公司','地址','薪资','日期']
for colnum in range(0,5):
ws.write(0,colnum,headData[colnum],xlwt.easyxf('font:bold on'))
index=1
for item in items:
for i in range(0,5):
ws.write(index,i,item[i])
index+=1
wb.save(newTable)

items=get()
excel_write(items)

猜你喜欢

转载自blog.csdn.net/qq_42276808/article/details/83115102

一个简单Python爬虫实例（爬取的是前程无忧网的部分招聘信息）

R语言爬取前程无忧网招聘职位

Python爬取前程无忧网站上python的招聘信息

python爬虫 requests+lxml爬取前程无忧网之模拟浏览器登录

scrapy爬虫进阶案例--爬取前程无忧招聘信息

Python爬虫：爬取招聘网站系列 - 前程无忧

Python Scrapy 爬取前程无忧招聘网

python scrapy爬取前程无忧招聘信息

Python爬虫新手入门教学（四）：爬取前程无忧招聘信息

【Python爬虫】招聘网站实战合集第一弹：爬取前程无忧

前程无忧网站，职位信息一步到位函数爬取！！！真一步到位

[Python] 前程无忧招聘网爬取软件工程职位网络爬虫 https://www.51job.com

python_爬虫爬取库房无忧网的库房数量

python_爬虫爬取库房无忧网的库房数据

51job（前程无忧官网）1万条招聘信息的爬取

python获取无忧网的招聘数据

最新 Python3 爬取前程无忧招聘网 mysql和excel 保存数据

爬虫实战：爬取前程无忧（51job）python相关职位信息

python爬虫--爬取前程无忧的工作岗位

python爬取前程无忧热门城市职位信息

python爬取前程无忧分析一波机械职位信息

招聘网站分析-前程无忧网站的爬虫设计与实现

requests+bs4+正则爬取前程无忧招聘信息进阶版

python搭建简单爬虫框架，爬取猎聘网的招聘职位信息

2.简单爬虫————爬取拉勾网招聘信息(一)

爬虫：一个简单的数据爬取统计实例

Python 爬取前程无忧最新招聘数据 matplotlib数据分析与可视化

一个非常简单的爬取网站图片的Python爬虫实例

一个简单的实例操作入门python爬虫--爬取漂亮小姐姐的图片

Python3.6爬虫集合 xpath bs4 re 爬51job前程无忧招聘信息豆瓣音乐等等

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)