北京PM2.5情况分析(2010-2014)

利用网上搜集到的CSV数据,对北京市2010年至2014年的PM2.5情况进行分析。

数据获取

数据来源于 UC Irvine Machine Learning Repository网站中的Beijing PM2.5 Data Data Set,数据文件类型为CSV。

数据清洗预览:

数据共43824条,13个维度,其中部分字段代表含义如下

TEMP:温度

PRES:大气压力

cbwd:风向

Iws:风速

Is:是否下雪

Ir:是否下雨

扫描二维码关注公众号,回复: 2969127 查看本文章

从数据中,可以发现pm2.5数据列中存在缺失值,2010-2014年的北京pm2.5的均值为98.6,中位数为92.0,区间为[0,994].

pm2.5数据反映的是某一日某一时刻的pm2.5值,观察缺失值,发现有的是某一日的值都缺失,有的是某一日的某几个时刻的值缺失。打算以天为单位统计pm2.5的值,所以若某一日中出现了缺失值,则删除该日的所有时刻的pm2.5值,即处理缺失值的方法为删除记录。

数据清洗之后,再经过数据集成和数据变换,最终可用数据数量如下所示,单位为:天数

数据分析可视化:

以天为单位,统计出每年的pm2.5值的变化情况,以2014年为例,如下图所示。

可以看出,4月-9月的pm2.5值要低于于10月-3月的pm2.5值,4月至9月的空气条件更好。

接下来,将2010-2014年的pm2.5值统计情况放在同一张图上,直观的看待这几年的变化。

从图中可以看出,近几年的pm2.5值稍有下降,箱式图上各分位数的值都是有所降低的。同时,每年也都存在异常值,且异常值的大小和数量没有明显的减少。为了更明显的发现统计规律,按照国家PM2.5检测网的空气质量的标准,根据24小时平均值标准值的分布来划分每天的空气质量等级,划分依据如下:

将数据按照空气质量等级和颜色划分后,绘制饼状图。

可以看出,2010年至1014年,北京市pm2.5等级为优良的天数占比分别为42.19%、48.27%、50.34%、49.69%和47.45%。相比于2010年,后四年的优良天数明显增多,pm2.5空气质量得到明显改善。

下面分析pm2.5空气质量等级改善的原因:

(1)降水

根据数据表中的降雨和降雪情况,找到降水超过6小时的日期,将这些日期对应的PM2.5值绘制图形,如下所示。

可以看出,除了少数几天外,绝大部分的pm2.5值都能控制在150以下,低于中度污染级别,优良级别的天数占比43.12%。

结论,pm2.5值不会因为降水而下降,空气质量不会因为降水而得到缓解

(2)刮风

根据数据提供的风向和风速情况,找到一天之内累计风速大于48m/s(相当于持续刮4级风累计6小时)的日期对应的pm2.5值,绘图如下所示

可以看出,这些日期中pm2.5值属于优良等级的占比为64.03%,比之前的优良率提高了很多。

结论

实际测量数值显示,降水和pm2.5数值没有因果性,降水本身并不能带动空气中的颗粒物沉降,颗粒物的浓度不会明显降低,降水不会对pm2.5数值产生显著影响。刮风可以显著降低pm2.5值,空气中颗粒物是被吹跑了而非沉降,浓度降低,pm2.5值明显下降。

看来提高空气质量,降低pm2.5的有效措施不是盼下雨而是等风来!

猜你喜欢

转载自blog.csdn.net/EAEelite/article/details/82079046