2019~2020年の新型コロナウイルス感染症流行の初期データ分析

1. データセットとタスク

2020-cNoV (2020.2.9現在)

今回は主に、累積確認症例数、退院症例数、死亡者数と症例が所在する州および都市との関係を分析します。

2. データセットの構成

このデータセットの元の主なデータには、州、市、時間、累積感染者数、累積退院者数、累積死亡者数、新規確認症例数、新規退院者数、新規死亡者数が含まれます。

3. データセットの前処理とフィールド計算

前処理: 初期データに欠損値があり、欠損データがフィルターで除外されます。

 4. ストーリーポイントの設計と説明   

         このストーリーポイントはダッシュボードの連携を採用しており、ワークシート1の州(左上:全国感染者数と流行マップ)とワークシート2(感染者数と流行のレベル棒グラフ)の4つのワークシート間に連携効果があります。各省および都市の状況)、ワークシート 3(湖北省 - 他の省および都市 - 確認された症例数と時間のフィッティング傾向グラフ)、ワークシート 4(各省および都市の退院率の散布図)。

1. 湖北省とその周辺省の感染状況は比較的深刻である

        スライダー時間フィルターは、さまざまな州や都市の感染者数の時間の経過に伴うおおよその変化を観察するために設定されています。発散する赤と青の色を使用し、赤が深刻さを表すように逆の順序を選択し、発散するように中心を調整します。もっと明白です。

        湖北省には人口が多いため、他の都市の流行状況をよりよく観察できるよう、湖北省を除外して右下隅に個別に表示しています。

 2. 武漢は感染者数と死者数で第1位

        ワードクラウド図と樹形図を使用すると、湖北省武漢市が最も多くの感染者と死亡者が確認されており、人の数も他の省よりもはるかに多いことがより直観的にわかります。中国での流行の様子。

3. 他の都市(湖北省を除く)の流行状況は安定している

        折れ線グラフを使用して、感染者数が最も多い湖北省を 1 つのグループに分け、その他の省と都市を 1 つのグループに分け、傾向線を追加して流行の展開を観察および分析します。

        1月24日から2月3日までの湖北省の累計感染者数は傾向線を下回り、状況は改善してきたが、2月3日以降は感染者数が横ばいから増加に転じ、1月全体としては10 1 月 24 日までゆっくりと増加し、その後、確認された症例数が急増しました。つまり、1 月 24 日が発生点でした。

        他の州の状況は1月20日から2月1日にかけて改善し、2月1日から2月7日にかけて増加傾向を示した。その後は比較的安定し、全体の感染者数はゆっくりと増加した。

4. 確認された症例数と退院率および死亡率の間には一定の相関関係があります。

        退院率および死亡率と感染確認者数の関係を分析すると、図から確認感染者数が0~1500人の場合と1500~3000人の場合の退院率は同様であることがわかります。も同様(死亡率も同じ)であり、適合度も非常に高く、感染者数、死亡率、退院率の間には一定の関係があると推測できます。

 

5. 確認された症例数は 300 人を超えており、確認された症例数が増加するにつれて退院率は低下します。

        箱ひげ図を使用して、退院率と確認症例数の関係を分析します。図から、300 未満の退院率には多くの外れ値があり、患者数と患者数には大きな差があることがわかります。感染者数が 100 未満の都市では異常値が多く、300 を超える都市では退院率が着実に増加しています。

 

おすすめ

転載: blog.csdn.net/m0_51744718/article/details/132398588