爬取全国城市近5.6年来空气质量情况 - 代码天地

爬取全国城市近5.6年来空气质量情况

其他 2019-06-15 23:34:48 阅读次数: 0

import urllib.request
import urllib.parse
import requests
import csv
from lxml import etree
from selenium import webdriver
import time

url='https://www.aqistudy.cn/historydata/index.php'
#broswer = webdriver.Chrome('C:\\Users\\lenovo\\AppData\\Local\\Programs\\Python\\Python37-32\\chromedriver.exe')
#broswer.get(url)
#c=broswer.find_elements_by_xpath('//td[@align="center"]')
#headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
response=requests.get(url)
html=etree.HTML(response.text)
city=html.xpath('/html/body/div[3]/div/div[1]/div[2]/div[2]/ul/div[2]/li/a/text()')
urls ='https://www.aqistudy.cn/historydata/monthdata.php?city='
listw=['名字','月份','范围','质量等级','PM2.5','PM10','SO2','CO','NO2','O3']
#with open('C:\\Users\\lenovo\\Desktop\\good3.csv', 'a+', newline='', encoding='utf-8')as f:
  # writers = csv.writer(f)
   #writers.writerow(listw)
liste=[]

for i in city:
    urls1=urls+urllib.parse.quote(i)
    broswer = webdriver.Chrome()
    broswer.get(urls1)
    time.sleep(3)
    with open('C:\\Users\\lenovo\\Desktop\\{}.csv'.format(i), 'a+', newline='', encoding='utf-8')as f:
        writers = csv.writer(f)
        writers.writerow(listw)
    c = broswer.find_elements_by_xpath('//td[@align="center"]')
    for j in range(0, len(c), 10):
           with open('C:\\Users\\lenovo\\Desktop\\{}.csv'.format(i), 'a+', newline='', encoding='utf-8')as f:
             writers = csv.writer(f)
             liste = [i, c[j].text, c[j + 1].text, c[j + 2].text, c[j + 3].text, c[j + 4].text, c[j + 5].text,
                     c[j + 6].text, c[j + 7].text, c[j + 8].text, c[j + 9].text]
             writers.writerow(liste)
    broswer.quit()

猜你喜欢

转载自www.cnblogs.com/persistence-ok/p/11029227.html

爬取全国城市近5.6年来空气质量情况

python爬取空气质量

Python爬取国家数据中心环境数据（全国城市空气质量小时报）并导入csv文件

全国主要城市空气质量热点图

网络爬虫-爬取指定城市空气质量检测数据

对空气质量历史数据的爬取

20180213 爬虫爬取空气质量数据

python获取全国各个城市pm2.5、臭氧等空气质量

全国113个城市空气质量的K均值聚类分析--基于R

中国空气质量在线监测平台加密数据爬取中国空气质量在线监测平台加密数据爬取

【爬虫实战】成都近五年的温度、空气质量变化趋势

数据爬去(js) 中国空气质量在线监测平台加密数据爬取

学习随笔-python动态爬取空气质量网数据的实现

中国空气质量在线监测平台加密数据爬取

python实现空气质量指数爬取，输出csv文件

空气质量数据爬取-checkpoint.ipynb

空气质量指数月统计历史数据爬取

python爬取天气网的全国空气质量指数排行榜（使用正则表达式和Xpath方法

基于flask的城市空气质量分析系统

python爬虫爬取（中国空气质量在线监测分析平台）北京PM2.5，2013年至2018年的数据

Python爬虫 -- 武汉市近年来空气质量数据

简单计算空气质量指数

scrapy下载中间件结合selenium抓取全国空气质量检测数据

基于大数据爬虫的全国空气质量指数实时数据可视化

使用QGIS实现城市空气质量指数（AQI）数据可视化

computer planetary——城市空气质量传感器数据集

机器学习大作业--Python城市空气质量的分析与预测

刷屏的北京雾霾，2018 年北上广深空气质量分析

Python爬虫实践：获取石家庄空气质量历史数据（13年至今）

2018年山西省环境空气质量综合指数平均下降10.8%

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)