Python 爬取数据（实例实操），并写入excel文件 - 代码天地

Python 爬取数据（实例实操），并写入excel文件

其他 2020-01-14 10:52:07 阅读次数: 0

1.准备工作

工具：pyCharm
安装： Python环境变量（网上查找）
可以在git中运行，也可以再cmd中运行，或者直接在工具pycharm中运行

2. 引入需要的模块和定义临时存储变量

# 引入需要的包和定义变量
from urllib import request
import re
from openpyxl import Workbook
wenjian=[] // 临时变量

#爬取功能
def getCont(url):
    response = request.urlopen(url)
    html = response.read().decode('utf-8')
    re_zz = re.compile(r'<h4 class="panel-title">(.*?)</h4>', re.S)
    list = re_zz.findall(html)
    re_url = re.compile(r'href="(.*?)"')
    re_title = re.compile(r'<a .*?>(.*?)</a>')
    re_html = re.compile(r'>(.*?)<')
    # print(list)
    for h in list:
        a_url = re_url.findall(h)[0]
        a_cont = re_title.findall(h)[0]
        wenjian.append([a_url, re_html.findall(a_cont)[1]])
    # print(wenjian)

# 存储功能
def cunchu():
    wb = Workbook()
    sheet = wb.active
    sheet.title = '菜鸟教程'
    for i in range(1, len(wenjian)):
        sheet.cell(1, 1).value = 'URL'
        sheet.cell(1, 2).value = 'Content'
        for j in range(0, 2):
            sheet.cell(row=i + 1, column=j + 1).value = wenjian[i-1][j]
            wb.save(r"F:\sample.xlsx")

# 入口函数
if __name__ == '__main__':
    for i in range(1, 3):
        print('正在爬取第%s页......' % i)
        url = 'https://c.runoob.com/examples/page/%s' % i
        getCont(url)
        print('第%s页爬取完毕！' % i)
        print('开始存储')
        cunchu()
        print('写入完毕')

gaodda

发布了22 篇原创文章 · 获赞 2 · 访问量 2876

私信关注

猜你喜欢

转载自blog.csdn.net/gaodda/article/details/95450603

Python 爬取数据（实例实操），并写入excel文件

python爬虫实操|爬取nba中国官网球员数据

python：数据写入文件excel

Python3爬虫之五：爬取网站数据并写入excel

python_将爬取的百度地图迁徙json数据写入到excel

Python学习笔记14：爬取51job数据，并写入excel中

Python利用get、post请求爬取数据并写入Excel表格

Python爬取网站数据并生成Excel

Python3：小爬虫成长记（三）---爬取数据并写入到文件

python爬取实例

实操 | 从0到1教你用Python来爬取整站天气网

python3爬取网页图片路径并写入文件

python创建Excel文件及写入保存数据

【Python】将数据写入excel文件中

python文件写入excel

python写入excel文件

python爬取全国疫情数据写入mysql

python3将爬取的数据写入execl表格

python写入excel数据

Python爬取网页中表格数据并导出为Excel文件

【Python爬虫】使用美味汤BeautifulSoup爬取数据并保存为Excel文件

Python爬取小说实例

Python爬取0复仇者联盟3：无限战争0评论并写入Excel

简易python爬虫爬取boss直聘职位，并写入excel

Python爬取博客园首页内容信息，并写入excel表，最后导入Mysql

Python爬虫经典案例详解：爬取豆瓣电影写入Excel表格

python爬取猫眼电影TOP100榜并将电影信息写入到Excel

使用动态代理爬取某房产平台信息并写入Excel（python）

python爬虫——爬取数据导入excel表

Python如何爬取数据保存到Excel中？

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)