python爬虫,爬取表格数据 - 代码天地

python爬虫,爬取表格数据

其他 2019-06-19 08:40:12 阅读次数: 0

python爬虫，爬取全国空气质量指数

编程环境：Jupyter Notebook
所要爬取的网页数据内容如下图

在这里插入图片描述

python爬虫代码及含义详细说明

#全国城市
import time
import requests
from bs4 import BeautifulSoup
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}#爬虫[Requests设置请求头Headers],伪造浏览器
# 核心爬取代码
url= 'http://www.tianqihoubao.com/aqi/aqi_rank.html'
params = {"show_ram":1}
response = requests.get(url,params=params, headers=headers)#访问url
listData=[]#定义数组
soup = BeautifulSoup(response.text, 'html.parser')#获取网页源代码
tr = soup.find('table',class_='b').find_all('tr')#.find定位到所需数据位置  .find_all查找所有的tr（表格）
# 去除标签栏
for j in tr[1:]:        #tr2[1:]遍历第1列到最后一列，表头为第0列
    td = j.find_all('td')#td表格
    Date = td[0].get_text().strip()           #遍历排名
    Quality_grade = td[1].get_text().strip()  #遍历城市
    AQI = td[2].get_text().strip()            #遍历空气质量指数AQI
    AQI_rank = td[3].get_text().strip()       #遍历PM2.5浓度
    PM = td[4].get_text()                     #遍历空气质量状况
    Cities = td[5].get_text()                  #遍历省份
    listData.append([Date,Quality_grade,AQI,AQI_rank,PM,Cities])
print (listData)#打印

运行结果如下

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_43488742/article/details/90742453

python爬虫,爬取表格数据

Python爬虫项目：爬取JSON数据存储Excel表格与存储图片

python爬虫爬取豆瓣书籍信息并生成表格

Python 爬虫小练习：基于 XPath 的表格信息爬取

爬虫入门之爬取静态网页表格数据

另类爬虫：从PDF文件中爬取表格数据

爬虫——爬取网页数据存入表格

python爬虫爬取网站数据

python爬虫东方数据爬取

python爬虫爬取猫眼电影数据

python爬虫：爬取拉勾网数据

python爬虫爬取斗鱼直播数据

python ：通过爬虫爬取数据（1）

python爬虫爬取异步加载的数据

Python爬虫爬取企查查数据

Python 爬虫爬取多页数据

Python爬虫爬取数据的步骤

python爬虫 - 爬取豆瓣上的数据

python爬虫：爬取新浪新闻数据

Python爬虫对json数据解析爬取

Python爬虫实战——爬取新闻数据（简单的深度爬虫）

Python 爬虫爬取单个基因表格数据的生物学功能（urllib+正则表达式）：

另类爬取表格数据

爬虫爬取网页上的表格

爬虫爬取机场网站的表格

Python3.模拟表单提交、爬取表格数据

python3将爬取的数据写入execl表格

Python：【2】使用Selenium爬取多页表格数据

Python爬虫实战--使用python爬取网站数据

Python 爬虫爬取网页

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)