Conduza estatísticas de dados e análises de pesquisas e use os dados em anexo para responder às seguintes perguntas:
⚫Pergunta 1: Por favor, realize estatísticas de classificação e resumo para calcular o número total de turistas de diferentes países de 1995 a 2020. Qual país tem mais turistas partindo e qual país tem mais turistas chegando?
Ideia : utilizar diretamente as funções do pacote pandas para acumular e contar o número de pessoas em cada país de saída e país de chegada.
Solução de problemas : Primeiro, você precisa ler os dados da tabela Excel.
import pandas as pd
import numpy as np
df=pd.read_csv('A题附件:国际旅游人数.csv')
df
Em seguida, conte o número total de pessoas que partem e chegam em cada país e registre o valor máximo. O código é o seguinte:
⚫Pergunta 2: Escolha um país e construa um modelo de previsão para o número de saídas de turistas no país , com base no país
Saídas turísticas de 1995 a 2020 , saídas turísticas previstas em 2030 e 2050 .
Ideia : Você pode escolher os Estados Unidos, que tem o maior número de partidas na questão 1 (é melhor escolher um país com dados anuais relativamente completos) e estabelecer um modelo de previsão de série temporal. Os modelos comuns incluem o modelo cinza, modelo arima, modelo holt, etc.
Resolução de problemas : Obtenha os dados do turismo do país ao longo dos anos através da triagem de dados e armazene os dados na lista.
Modelo ARMIA
⚫Pergunta 3: Por favor, realize estatísticas de dados, estabeleça um modelo de rede de turismo em diferentes países e analise quais são os dois países que viajam com mais frequência ? E analise como esse relacionamento frequente muda ao longo do tempo.
Idéia : Esta questão precisa estabelecer pares de países e calcular a soma do número de turistas entre cada par de países, para construir um modelo de rede. Cada nó representa um país e cada aresta representa o número de turistas entre dois nós (países) correspondentes. Finalmente, a matriz de adjacência do grafo da rede é gerada.
Então, através da matriz calculada, o par de países com mais turistas é o par de países mais frequente.
Calcule as chegadas de turistas ao país ao longo dos anos e desenhe um gráfico de linhas para analisar as mudanças.
Resolução de problemas : Combinando os requisitos acima, calcule a matriz de adjacência do modelo de rede:
#代码请私戳获取
⚫Pergunta 4: Analise os dados do anexo, com base no horário, número de turistas, origem e destino turístico, que outras conclusões você pode tirar da análise e realize mineração de dados e análise visual .
Idéia : você pode contar os principais países de partida e chegada ao longo dos anos e analisar quais países são países turísticos populares e como eles mudaram ao longo do tempo.
É possível contar separadamente as mudanças no número de viajantes em vários países populares para viagens ao longo dos anos e analisar como o número de viajantes em cada país mudou ao longo do tempo.
É também possível calcular o número médio global de turistas em cada país, contar os países que se afastam muito da média e analisar as razões deste desvio em combinação com a situação real.