获取重庆空气质量历史数据写入csv文本 - 代码天地

获取重庆空气质量历史数据写入csv文本

其他 2018-10-31 06:11:05 阅读次数: 0

import re
import csv
import numpy
import codecs
from bs4 import BeautifulSoup
from urllib.request import urlopen


def get_table_head(url):
    """ 该函数用于获取带表头的数据 """
    html_bj = urlopen(url)
    bsp_bj = BeautifulSoup(html_bj, "lxml")  # 获取BeautifulSoup对象

    table_list = bsp_bj.findAll("tr")  # 获取所有的表格

    data_list = []
    table_head = table_list[0].get_text().strip("\n").split("\n\n")
    data_list.append(table_head)  # 获取表头

    return data_list


def get_data(url):
    """ 该函数用于获取不带表头的数据 """
    html_bj = urlopen(url)
    bsp_bj = BeautifulSoup(html_bj, "lxml")

    table_list = bsp_bj.findAll("tr")

    data_lists = []
    for data_list in table_list[1:]:
        data = data_list.get_text().replace(" ", "").replace("\n\r", ""). \
            strip("\n").split("\n")
        data_lists.append(data)

    return data_lists


# 兰州空气质量指数(AQI)-PM2.5查询地址：
start_url = "http://www.tianqihoubao.com/aqi/chongqing.html"
html = urlopen(start_url)
bso_bj = BeautifulSoup(html, "lxml")  # 获取BeautifulSoup对象

# 找到所有存放月度数据的网页链接，并以列表的形式按月份先后顺序保存这些链接
Sites = []
for link in bso_bj.findAll(href=re.compile("^(/aqi/chongqing-)")):
    site = "http://www.tianqihoubao.com" + link.attrs['href']
    Sites.append(site)
Sites.reverse()

Data_set = get_table_head(Sites[0])  # 获取表头

for url in Sites:
    data_set = get_data(url)        # 获取所有月度数据
    for data in data_set:
        del data[3]
    Data_set = numpy.row_stack((Data_set, data_set))   # 拼接表头和数据

with open("Data.csv", "w+") as csv_file:
    csv_file.write(codecs.BOM_UTF8.decode())
    writer = csv.writer(csv_file)
    for i in range(numpy.shape(Data_set)[0]):
        writer.writerow((Data_set[i, :]))    # 将数据逐行写入csv文件

猜你喜欢

转载自blog.csdn.net/qq_42029527/article/details/83547698

获取重庆空气质量历史数据写入csv文本

对空气质量历史数据的爬取

空气质量指数日历史数据

Python爬虫实践：获取石家庄空气质量历史数据（13年至今）

气象历史数据和空气质量历史数据资源汇总免费

空气质量指数月统计历史数据爬取

20180213 爬虫爬取空气质量数据

收集空气质量数据走的路

PurpleAir空气质量数据采集

Python爬取国家数据中心环境数据（全国城市空气质量小时报）并导入csv文件

简单计算空气质量指数

python爬取空气质量

python 获取指定城市【昨日天气+未来15天预报天气+空气质量+气象数据】

python实现空气质量指数爬取，输出csv文件

地级市空气污染、空气质量、PM2.5日度数据

中国空气质量在线监测平台加密数据爬取中国空气质量在线监测平台加密数据爬取

python获取全国各个城市pm2.5、臭氧等空气质量

数据爬去(js) 中国空气质量在线监测平台加密数据爬取

空气质量数据网页爬虫加数据处理

基于大数据爬虫的全国空气质量指数实时数据可视化

scrapy下载中间件结合selenium抓取全国空气质量检测数据

ELK实践（三）北京历年空气质量数据分析

学习随笔-python动态爬取空气质量网数据的实现

网络爬虫-爬取指定城市空气质量检测数据

中国空气质量在线监测平台加密数据爬取

空气质量数据爬取-checkpoint.ipynb

R语言用线性回归模型预测空气质量臭氧数据

Python数据分析之空气质量（AQI）分析与预测 1

天气预报实况6要素空气质量限号数据接口更新

爬虫：利用selenium采集某某环境网站的空气质量数据

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)