2019-2020年新冠肺炎爆发初期数据分析

一、数据集及任务

2020-cNoV (截止到2020.2.9)

本次主要分析累计确诊、出院、死亡病例及病例所在省份、城市之间的关系。

二、数据集的组成

本数据集原始主要数据包括:省份,城市,时间,累计确诊病例数量,累计出院病例数量,累计死亡病例数量,新增确诊病例数量,新增出院病例数量,新增死亡病例数量

三、数据集的预处理与字段计算

预处理:初始数据存在缺失值,筛选去掉缺失数据。

 四、故事点的设计与说明   

         此故事点采用了仪表盘的联动,四个工作表之间都有联动效果,工作表一(左上:全国确诊人数疫情地图)的省份,工作表二(各省市确诊人数疫情水平条形图)、工作表三(湖北-其他省市-确诊人数及时间拟合趋势图)、工作表四(各省市出院率散点图)。

1.湖北省及其周边省份疫情比较严重

        设置了滑块时间筛选器,可以观察随时间变动各省市确诊人数的大致变化,使用发散型红蓝颜色,选择倒序让红色代表严重,调整中心,发散更明显。

        因为湖北省人数较多,所以将湖北省排除掉在右下角单独展示,以便更好地观察到其他城市的疫情情况。

 2.武汉确诊及死亡人数占据首位

        采用了词云图和树状图,可以更直观的看出来确诊人数和死亡人数最多的是湖北省武汉市,且人数远远多于其他省份,湖北武汉是中国疫情的爆发点。

3.其他(除湖北)城市疫情趋于平缓

        利用折线图,将确诊人数最多的湖北分为一组,其他省市分为一组,增加趋势线观察分析疫情发展的情况。

        湖北省在1月24日到2月3日累计确诊病例处于趋势线之下,即情况有所好转,但2月3日以后,确诊人数又由平缓趋于上升趋势;总体在1月10日到1月24日缓慢增加,之后确诊人数激增,即1月24日是个疫情爆发点。

        其他省份在1月20到2月1日左右情况有所好转,2月1日到2月7日左右情况有所呈现上升趋势,之后比较稳定,总体确诊缓慢增加。

4.确诊人数与出院率及死亡率有一定的相关性

        分析出院率和死亡率与确诊人数之间的关系,从图中可以看出,确诊人数在0-1500之间的出院率不相上下,1500-3000之间的出院率也不相上下(死亡率同样),并且拟合度也很高,可以推测确诊人数与死亡率,出院率之间有一定的关系。

 

5.确诊人数大于300,出院率确诊人数增加的而下降

        利用盒须图,分析出院率与确诊人数之间的关系,由图可观察到,<300的出院率有许多异常值,在<100的城市中确诊人数有很大差异,出现了许多异常值,而在>300的城市,出院率稳步提升

猜你喜欢

转载自blog.csdn.net/m0_51744718/article/details/132398588
今日推荐