1. Conjuntos de dados e tarefas
2020-cNoV (a partir de 2020.2.9)
Desta vez analisamos principalmente a relação entre o cumulativo de casos confirmados, casos com alta, óbitos e as províncias e cidades onde os casos estão localizados.
2. Composição do conjunto de dados
Os principais dados originais deste conjunto de dados incluem: província, cidade, horário, número cumulativo de casos confirmados, número cumulativo de casos com alta, número cumulativo de mortes, número de novos casos confirmados, número de casos com alta e número de novas mortes
3. Pré-processamento de conjunto de dados e cálculo de campo
Pré-processamento: há valores ausentes nos dados iniciais e os dados ausentes são filtrados.
4. Design e explicação dos pontos da história
Este story point adota a ligação do painel, e há efeitos de ligação entre as quatro planilhas: as províncias da planilha um (canto superior esquerdo: mapa nacional de casos confirmados e situação epidêmica) e da planilha dois (gráfico de barras de casos confirmados e níveis epidêmicos em cada província e cidade), Planilha 3 (Hubei - outras províncias e cidades - ajuste do gráfico de tendência do número de casos confirmados e tempo), Planilha 4 (gráfico de dispersão das taxas de alta em cada província e cidade).
1. A situação epidêmica na província de Hubei e nas províncias vizinhas é relativamente grave
Um filtro de tempo deslizante é configurado para observar as mudanças aproximadas no número de casos confirmados em várias províncias e cidades ao longo do tempo. Use cores divergentes de vermelho e azul, selecione a ordem inversa para que o vermelho represente a gravidade e ajuste o centro para fazer a divergência mais óbvio.
Como há um grande número de pessoas na província de Hubei, a província de Hubei é excluída e exibida separadamente no canto inferior direito para melhor observar a situação epidêmica em outras cidades.
2. Wuhan ocupa o primeiro lugar em número de casos confirmados e mortes
Usando diagramas de nuvem de palavras e diagramas de árvore, podemos ver de forma mais intuitiva que a cidade de Wuhan, província de Hubei, tem o maior número de casos confirmados e mortes, e o número de pessoas é muito maior do que outras províncias. Wuhan, província de Hubei, é o ponto de surto de a epidemia na China.
3. A situação epidêmica em outras cidades (exceto Hubei) se estabilizou
Use um gráfico de linhas para dividir Hubei, que tem o maior número de casos confirmados, em um grupo, e outras províncias e cidades em um grupo, e adicione linhas de tendência para observar e analisar o desenvolvimento da epidemia.
O número cumulativo de casos confirmados na província de Hubei, de 24 de janeiro a 3 de fevereiro, ficou abaixo da linha de tendência, ou seja, a situação melhorou. No entanto, depois de 3 de fevereiro, o número de casos confirmados mudou de estável para ascendente; no geral, em janeiro 10 Aumentou lentamente até 24 de Janeiro e depois o número de casos confirmados aumentou, ou seja, 24 de Janeiro foi o ponto do surto.
A situação nas outras províncias melhorou de 20 de Janeiro a 1 de Fevereiro e mostrou uma tendência ascendente de 1 a 7 de Fevereiro. Depois disso, tornou-se relativamente estável e o número global de casos confirmados aumentou lentamente.
4. Existe uma certa correlação entre o número de casos confirmados e a taxa de alta e a taxa de mortalidade.
Analisando a relação entre a taxa de alta e a taxa de mortalidade e o número de casos confirmados, percebe-se pela figura que as taxas de alta são semelhantes quando o número de casos confirmados está entre 0 e 1.500, e as taxas de alta entre 1.500 e 3.000 também são semelhantes (mortes A taxa é a mesma), e o grau de adaptação também é muito alto, podendo-se inferir que existe uma certa relação entre o número de casos confirmados, a taxa de mortalidade e a taxa de alta.
5. O número de casos confirmados é superior a 300 e a taxa de alta diminui à medida que o número de casos confirmados aumenta.
Use um gráfico de caixa e bigode para analisar a relação entre a taxa de alta e o número de casos confirmados.Pode-se observar na figura que existem muitos valores discrepantes na taxa de alta <300, e há grandes diferenças no número de casos confirmados em cidades com <100, com muitos valores discrepantes. e em cidades >300, a taxa de alta tem aumentado constantemente