2020广州数模联赛思路

赛题

赛题是根据数据,数据从link下载。分析两个问题:

  • 建立数学模型,综合考虑人口数、感染数量、病死人数、疫情持续时间、经济状况、医疗条件、人口密度、防疫政策等因素,给出一个合理的界定“流行”(Epidemic) 和“大流行”(Pandemic)病的定量条件。(补充:世界卫生组织发布大流行的时间是3月11日)
  • 考虑到无症状感染者具有一定的传染性,且不容易发现,但全民进行病毒检测又成本太高,且时间过长,不利于复工复产,我们试图寻找一种更为有效的方法来最大限度地降低无症状感染者的传播风险,比如对一个地区进行抽样病毒检测来评估该地区的无症状感染者的分布情况,再制定不同的隔离和检测措施。请结合问题一的模型,针对一两个国家(或地区),给出切实可行的病毒检测抽样方案,并给出无症状感染者分布预测模型和针对相应预测结果的应对方案。

然后外带需要写一份信给世界卫生组织,告诉他你的感想吧。

问题一做法

我用的是 world_aggregated 表格,里面有新冠病毒的确诊康复死亡人数随时间的记录。根据世界卫生发布大流行的时间 3 月 11 日,然后给世界数据加上标签。即 3月11日之前的数据标记为 0,之后的数据标记为 1。当然,给出的数据是 世界的确诊、康复、死亡人口数随时间的变化。为了考虑经济水平、医疗水平等乱七八糟的内容,还应该到 世界银行 上找资料。这里我找的是 世界平均 GDP 、国民调整净收入、人口、土地面积,与上述疫情时序数据相结合。

怎么结合呢?我用除法。看似简单,实际上大智若愚啊。因为后面,我吧大流行定量条件问题,视为什么时候大流行的问题。也就是说,可以将问题转换为序列预测问题。也就是说把刚才打的标签作为因变量,其余数据作(处理过后)为自变量,然后用机器学习的方式学习出来。由于数据是时序相关的,也就是说目前的数据与之前的数据或者历史的数据都相关。因此我使用了机器学习中的序列神经网络 LSTM ,来挖掘定量条件。

由于神经网络属于深度学习,其挖掘特征是自动挖掘的。也就是说,我们没必要多此一举,去手工地提取特征作为输入。

问题二做法

这里要感谢我的一位朋友,没有他的提醒,我没能想到这一问的做法。

抽样方案就不说了,无外乎分层抽样。

抽样后,怎么判断无症状感染者的分布情况呢?或者说,无症状感染人数,占总人数的比例为多少?

于是,我用了生物统计学中的U检验模型。其示例如下:
在这里插入图片描述
在这里插入图片描述
大概就这些啦,广州地区的比赛不是很难,就是赛题很扯淡!!!!!!
初赛入选了二等,出乎意料,比我想象中的要低一点,哈哈。复赛中

猜你喜欢

转载自blog.csdn.net/weixin_42141390/article/details/106204517