新型コロナウイルス感染症流行予測モデル -- ロジスティック回帰フィッティング、SEIR モデル

14e116dba74a49dfb6c9993a5f342fd1.jpeg

 「」

武道の世界でカイゴウとして知られる無名の大学生
原作者: ジャッキー・リー
電子メール: [email protected]
最終編集日: 2022.11.14

「」

 ボス、寄り道してください、これは負けです。

目次

 ボス、寄り道してください、これは負けです。

(1) ロジスティック成長曲線

ロジスティックフィッティングコード 

(2) 疾病伝播モデル-SEIR

 SEIR モデルコード

オンライン SEIR モデル視覚化プラットフォーム

GNN に基づく COVID-19 流行の進展予測

コード:


 

統計モデル、数学モデルを構築するか、流行の発展傾向に適合する機械学習や深層学習手法を使用することにより、過去のデータを使用して、将来の確定症例やその他の流行状況を予測することができます。たとえば、ロジスティック増殖曲線フィッティングデータ、予測の可能性のある発展の可能性があります。予測モデルを構築するために時系列モデルを使用することもできます。また、LSTM を使用して予測モデル (特別な RNN ネットワーク) を構築することもできます。上記手法では、成長曲線を除く他のモデルは学習に大量のデータを必要としますが、現状を見る限りデータ量は多くなく、モデルを構築しても基準値が得られません。素晴らしいです。ビジネスと統合されておらず、データによってのみ理解されます。データ。

  モデリングのもう 1 つのアイデアは、従来の疾患伝播モデル (SIS、SIR、SEIR など) から感染症モデルを構築し、このコロナウイルスの伝播特性を組み合わせ、既存のサンプル数を使用して大まかなパラメータを推定し、感染症モデルを確立することです。感染症の数学的モデルは、感染症の流行傾向をより正確に予測できますが、これはより複雑で専門的な問題です。最近、学者の鍾南山氏らのチームが研究・構築した「発生率が飽和したSIQS感染症モデル(どんな感染症も発生率は飽和している、つまり完全に排除できないという説明)」が却下されたが、海外の権威ある学術誌によると、研究結果は依然として国内の感染症の発展傾向と一致しています。

  関連する学者によると、SIQS感染症モデルは実際には伝統的なSEIRモデルに、国の強力な介入と春節後の戻りのピークという2つの介入要素を加えたものであるという。チームは、2020年1月23日前後の人口移動データと最新の新型コロナウイルス感染症疫学データをSEIRモデルに統合した「公衆衛生介入下の新型コロナウイルス感染症流行動向のSEIRとAI予測改訂」というタイトルの記事を発表しました。さらに、チームは人工知能テクノロジーを使用して、2003 年の SARS データに基づいたトレーニングを実施し、新たなクラウン流行をより正確に予測しました。研究チームはまた、長期短期記憶モデルを使用して、新規感染者数の経時的変化を予測した。基本的なトレーニング データ セットの処理のために、研究チームは 2003 年 4 月から 6 月までの SARS の症例統計を使用し、新型コロナウイルス感染症 (COVID-19) の疫学パラメーターを組み込みました。学会員の鍾南山氏のチームの研究結果から判断すると、純粋な技術チームであると仮定すると、強い解釈可能性と高い信頼性を備えた予測モデルを作成することは不可能であるため、データモデリングは技術ツールに依存するだけでなく、ビジネスとのより多くのデータモデリングに依存します。理論的背景を考慮すると、モデルは冷淡な技術的な実装ではなく、ビジネスとテクノロジーの温かく含意のある統合である必要があります。

  私は感染症や医学の専門知識がないので、専門外の観点から泰安市の累計感染者数をロジスティック増加曲線でシミュレーションして簡単に説明してみました。従来の疾病伝播モデル - SEIR。

(1) ロジスティック成長曲線

ロジスティック曲線は、ベルギーのデータサイエンティストによって最初に発見された特別な曲線であり、その後、生物学者の R. パールと L.J. リードがこの理論に基づいて人口増加の法則を研究したため、ロジスティック増加曲線は成長曲線またはパール曲線とも呼ばれます。ロジスティック成長曲線の一般的な形式は次のとおりです。

Yt=L1+はい-bt

L、a、b はすべて未知のパラメーターであり、履歴データに基づいて推定する必要があります。成長曲線は、現代のビジネス、生産産業、生物学などで広く使用されています。

私たちは成長曲線モデルを使用して、2022年3月1日から4月30日までの上海での累積確認症例データを当てはめ、成長曲線モデルを確立しました。データフィッティングは以下の図に示されており、青色の部分は確定症例の観測値、オレンジ色の部分は確定症例の予測値を示しており、3日間の確定予測症例データが計算されています(5月7日) 、5月8日、5月9日)。

facaeb86b71a47bf8eaabed400277215.png

ロジスティックフィッティングコード 

ca0639ca29db4277aafdf3270507e455.png

0f0a3aafa96dfc1cfbcc4ef315e980e2.png

 

242653961c1d3f6a4ba13d51c7484c47.png

e0a0902b64e05d1647a881a7392e2ded.png

上図の予測値によって生成された曲線から判断すると、成長曲線モデルは全体的に「S」字型を示しており、関連参考文献によると、成長曲線は初期段階、中期段階、最終段階の 3 つの段階に分けることができます。

初期段階では、t は成長段階にありますが、y の成長は比較的遅く、この時点では曲線は緩やかな上昇を示します。

中期的には、t の増加に伴って y の増加率が徐々に増加し、関数の飽和度の増大により、変曲点 (t, Y) に達すると、曲線は急激な上昇傾向を示します。最後に到達すると、t が増加するにつれて、成長は比較的遅くなり、成長率は 0 に近づき、曲線は水平に発展します。

  モデルの特性を理解した上で、外部要因がイベントの進行を妨げると仮定すると、データの急激な増加または減少が発生し、モデルの予測精度に影響を与えます。したがって、ロジスティック成長モデルは疾患を推定するだけで正確に判断することはできず、最適なモデルでもありません。もちろん、モデルの最適化によって予測精度を向上させることは可能であり、得られたモデルを Hua Luogeng が提案した 0.618 最適化手法 (モデルが予測値の最小二乗残差和を取得できるかどうかを計算) に従って最適化できることを提案する文献もあります。と測定値)。ここでは詳細には立ち入りませんので、後で議論して学習してください。

(2) 疾病伝播モデル-SEIR

  関連文献を検討した結果、一般的な感染症モデルは感染症の種類に応じて SI、SIR、SIRS、SEIR モデルなどに分類されており、蔓延速度、空間範囲、感染経路、感染経路などを研究するために使用されていることがわかりました。感染症のその他の問題、および感染症の治療、予防と管理の指針として使用されます。モデルには、S、E、I、R、r、β、γ、α パラメーターが含まれます。

  カテゴリーS:感受性、病気ではないが免疫力が欠如しており、感染者との接触後に容易に感染する人を指す;カテゴリーE:暴露、感染者と接触したことはあるが、一時的に無力化した人を指す他の人に感染させる、潜伏期間の長い感染症に適している; カテゴリー I: 感染性、カテゴリー S のメンバーに伝染し、カテゴリー E またはカテゴリー I のメンバーに変わる可能性がある感染症に感染した人々を指す; カテゴリー R: 回復, 隔離されている人や病気から回復して免疫を持っている人を指します。免責期間が限られている場合、Rカテゴリーの会員は再びSカテゴリーに変更することができます。

  r: 感染患者 (I) が毎日接触する感受性のある人の数; β: 病気自体の伝播能力と集団の予防および制御能力によって決定される感染係数; γ: 一般に回復係数インフルエンザの経過など、病気の経過の逆数 5 日の場合、その γ は 1/5 です; α: 潜伏感染者の発症確率、一般に潜伏期間の逆数。

c8c59ad5678f538950ac5c849ca628ce.png

私たちは、収集したデータを流行の展開のシミュレーションに使用しなくなりました。その理由は、モデルに含まれるさまざまなパラメーターをより適切に推定することができないためです。また、考慮する必要があるパラメーターが多数あるためです。 , データはモデルを裏付けることができません. 導出, 特に流行の政府介入要因と社会世論要因は, 流行の発展傾向に一定の影響を与えるため, 関連する要因を考慮する必要があります. したがって, この問題はは比較的複雑なプロセスなので、ここでは詳しく説明しません。興味のある人は誰でも、関連する文献や資料を検索し、徹底的な調査や研究を行うことができます。

 SEIR モデルコード

cd4b09b3f6ea4e9495b7b0ef42cda905.png

6b5df7aa6​​cb1db6e08862708396d585f.png

 

06311b0788444401702dc46ed4a8a4d2.png

オンライン SEIR モデル視覚化プラットフォーム

c8e07a58996f44922a8f8854848e8b0d.png

GNN に基づく COVID-19 流行の進展予測

506ad23ea520037ac9db8f9f915a7f55.png

a3a183265a49a75e02f01895a82c73ed.png

コード:

ソースコードが必要な場合は、ブロガーとプライベートにチャットしてください。ブロガーはそれを見て返信します。

いいねと注目をありがとう!

 

 

おすすめ

転載: blog.csdn.net/weixin_62075168/article/details/127853939