数据之路- 中国五城市PM2.5数据解读

PM2.5大家一定都不会陌生,特别是在北京生活的小伙伴们。PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米。在环境科学中,特指悬浮在空气中的固体颗粒或液滴,是空气污染的主要来源之一。
本文旨在探寻中国五大城市的PM2.5指数的数据情况及变化趋势,发现一些潜在规律并试图找到和PM2.5相关的一些天气因素。

数据整理和清洗

文中采用的数据集下载自Kaggle,基础数据如下:
在这里插入图片描述
先使用python对数据集进行了整理,将五张数据表合并为一张表,并删除暂不分析的数据,然后进行数据清洗,剔除其中为NA的数据。
合并后数据格式如下:
在这里插入图片描述

其中 PM_US_Post表示PM2.5的数值,时间精确到小时,使用 year、month、day、hour共同描述,即每一天有24条记录, 还有一些字段是专业数据我们会在后面介绍

使用python做了基础数据整理后,我们再使用Tableau进行可视化分析展示
我们先来看一下2010年至2015年,这五大城市的PM2.5指数的大体趋势情况:

我是交互超链接

上图可见,截至2015年,五大城市中,以北京PM2.5指数值最高,广州的PM2.5的指数值最低。
北京、上海、广州、成都自2013年以来PM2.5指数值都持续有所下降,唯独沈阳2013年PM2.5指数升高,目前已经排名第二位。

总体来说PM2.5的指数有所下降,环境问题得到了改善。

让我们再聚焦到2015年,看看PM2.5的数据情况:

我是交互超链接

上图可见,在采样数据基本均匀的情况下,五城市在不同季节呈现出了明显的差异。
在夏季各地的空气质量都是比较不错的,表现最差的北京在夏季PM2.5的平均值也能达到50, 而到了冬季,各地的污染指数都远大于夏季,北京的PM2.5均值达到了120。

我们在来看看具体到每月的情况:

我是交互超链接

PM2.5的分级标准为:

  1. 优 35微克(ug)/每立方
  2. 良 35~75微克(ug)/每立方
  3. 轻度污染 75~115微克(ug)/每立方
  4. 中度污染 115~150微克(ug)/每立方
  5. 重度污染 150~250微克(ug)/每立方
  6. 严重污染 250及以上微克(ug)/每立方

上图可见,拥有最多优质天气的城市是广州,6月份中收获了29个优质天气,全年优质天气最多的月份在九月。而拥有最多严重污染的城市是北京,在12月有8天达到了严重污染。12月也是全年中空气质量最差的一个月。

既然这样,我们就试着分析一下,北京的空气质量这么差到底与哪些因素有关。
我们先看一下北京全年的PM2.5指数及相关几个系数的走势图:

我是交互超链接

这里我们先了解几个指标系数:

  1. DEWP: 露点
  2. TEMP: 温度
  3. PRES:气压
  4. cbwd: 组合风向
  5. Iws: 累积风速
  6. HUMI:湿度
  7. precipitation:降水

依据上图我们简单可以看出,PM2.5的走势跟露点、湿度变化的走势是比较吻合的,而和累计风速则成反向变动。所以我们看在夏季,虽然露点和湿度的曲线变化比较大,但因为风力平稳持续,所以PM2.5曲线平稳。到了冬季大部分日子风力比较弱,PM2.5曲线同露点和湿度曲线变化就非常贴近了。

我们选取1月份PM2.5数值最大的一天,来看看当天的数据变化情况:

我是交互超链接

上图可见13时为全天PM指数最高时段,同时露点和湿度也是峰值,而此时风力相对较小。而风力最大时段是在上午8时,此时PM指数全天最小。
PM2.5确实是个很大的课题,专业程度又比较高,基于目前的字段信息就先分析到这里了,期待后续有了更多的知识和技术积累,能分析出更多有意义的观点了。
ps:CSDN嵌入的Tableau的图表无法交互,点击图表下方 交互超链接 可查看动图

猜你喜欢

转载自blog.csdn.net/weixin_40540748/article/details/83507987