Análise de Big Data da Rede Internacional de Turismo para a Pergunta A - Análise detalhada e respostas de código (2023 National University Data Statistics and Survey Analysis Challenge

Conduza estatísticas de dados e análises de pesquisas e use os dados em anexo para responder às seguintes perguntas:

⚫Pergunta 1: Por favor, realize estatísticas de classificação e resumo para calcular o número total de turistas de diferentes países de 1995 a 2020. Qual país tem mais turistas partindo e qual país tem mais turistas chegando?

Ideia : utilizar diretamente as funções do pacote pandas para acumular e contar o número de pessoas em cada país de saída e país de chegada.

Solução de problemas : Primeiro, você precisa ler os dados da tabela Excel.

 

import pandas as pd

import numpy as np

df=pd.read_csv('A题附件:国际旅游人数.csv')

df

Em seguida, conte o número total de pessoas que partem e chegam em cada país e registre o valor máximo. O código é o seguinte:

 

⚫Pergunta 2: Escolha um país e construa um modelo de previsão para o número de saídas de turistas no país , com base no país

Saídas turísticas de 1995 a 2020 , saídas turísticas previstas em 2030 e 2050 .

Ideia : Você pode escolher os Estados Unidos, que tem o maior número de partidas na questão 1 (é melhor escolher um país com dados anuais relativamente completos) e estabelecer um modelo de previsão de série temporal. Os modelos comuns incluem o modelo cinza, modelo arima, modelo holt, etc.

Resolução de problemas : Obtenha os dados do turismo do país ao longo dos anos através da triagem de dados e armazene os dados na lista.

 

 Modelo ARMIA

 

⚫Pergunta 3: Por favor, realize estatísticas de dados, estabeleça um modelo de rede de turismo em diferentes países e analise quais são os dois países que viajam com mais frequência ? E analise como esse relacionamento frequente muda ao longo do tempo.

Idéia : Esta questão precisa estabelecer pares de países e calcular a soma do número de turistas entre cada par de países, para construir um modelo de rede. Cada nó representa um país e cada aresta representa o número de turistas entre dois nós (países) correspondentes. Finalmente, a matriz de adjacência do grafo da rede é gerada.

Então, através da matriz calculada, o par de países com mais turistas é o par de países mais frequente.

Calcule as chegadas de turistas ao país ao longo dos anos e desenhe um gráfico de linhas para analisar as mudanças.

Resolução de problemas : Combinando os requisitos acima, calcule a matriz de adjacência do modelo de rede:

 

#代码请私戳获取

⚫Pergunta 4: Analise os dados do anexo, com base no horário, número de turistas, origem e destino turístico, que outras conclusões você pode tirar da análise e realize mineração de dados e análise visual .

Idéia : você pode contar os principais países de partida e chegada ao longo dos anos e analisar quais países são países turísticos populares e como eles mudaram ao longo do tempo.

É possível contar separadamente as mudanças no número de viajantes em vários países populares para viagens ao longo dos anos e analisar como o número de viajantes em cada país mudou ao longo do tempo.

É também possível calcular o número médio global de turistas em cada país, contar os países que se afastam muito da média e analisar as razões deste desvio em combinação com a situação real.

Para etapas e códigos detalhados de resolução de problemas, envie um carimbo particular para obter ~

おすすめ

転載: blog.csdn.net/lichensun/article/details/132392196