Análisis de big data de la red de turismo internacional para la pregunta A: análisis detallado y respuestas de código (desafío de análisis de encuestas y estadísticas de datos de la Universidad Nacional 2023)

Realice estadísticas de datos y análisis de encuestas, y utilice los datos del archivo adjunto para responder las siguientes preguntas:

⚫Pregunta 1: Realice una clasificación y estadísticas resumidas para calcular el número total de turistas de diferentes países entre 1995 y 2020. ¿De qué país salen más turistas y a qué país llegan más turistas?

Idea : utilice directamente las funciones del paquete pandas para acumular y contar el número de personas en cada país de salida y de llegada.

Resolución de problemas : primero, debe leer los datos de la tabla de Excel.

 

import pandas as pd

import numpy as np

df=pd.read_csv('A题附件:国际旅游人数.csv')

df

Luego cuente el número total de personas que salen y llegan a cada país por turno y registre el valor máximo, el código es el siguiente:

 

⚫Pregunta 2: Elija un país y cree un modelo de pronóstico para el número de salidas de turistas en el país , según el país.

Salidas de turistas de 1995 a 2020 , salidas de turistas previstas en 2030 y 2050 .

Idea : Es posible que desee elegir Estados Unidos, que tiene el mayor número de salidas en la pregunta 1 (es mejor elegir un país con datos anuales relativamente completos) y establecer un modelo de pronóstico de series de tiempo. Los modelos comunes incluyen el modelo gris, modelo arima, modelo holt, etc.

Resolución de problemas : obtenga los datos turísticos del país a lo largo de los años mediante la selección de datos y almacene los datos en la lista.

 

 modelo ARMIA

 

⚫Pregunta 3: Realice estadísticas de datos, establezca un modelo de red de turismo en diferentes países y analice cuáles son los dos países que viajan con más frecuencia . Y analizar cómo esta relación frecuente cambia con el tiempo.

Idea : Esta pregunta necesita establecer pares de países y calcular la suma del número de turistas entre cada par de países, para construir un modelo de red. Cada nodo representa un país y cada borde representa el número de turistas entre dos nodos (países) correspondientes. Finalmente, se genera la matriz de adyacencia del gráfico de red.

Luego, a través de la matriz calculada, el par de países con más turistas es el par de países más frecuente.

Calcule las llegadas de turistas al país a lo largo de los años y dibuje un gráfico de líneas para analizar los cambios.

Resolución de problemas : Combinando los requisitos anteriores, calcule la matriz de adyacencia del modelo de red:

 

#代码请私戳获取

⚫Pregunta 4: Analice los datos del archivo adjunto, según el tiempo, la cantidad de turistas, el origen y el destino del turista, qué otras conclusiones puede sacar del análisis y realice una extracción de datos y un análisis visual .

Idea : puede contar los principales países de salida y llegada a lo largo de los años y analizar qué países son turísticos populares y cómo han cambiado con el tiempo.

Es posible contar por separado los cambios en el número de viajeros en varios países turísticos populares a lo largo de los años y analizar cómo ha cambiado el número de viajeros en cada país con el tiempo.

También es posible calcular el número medio general de turistas en cada país, contar los países que se desvían mucho del promedio y analizar las razones de esta desviación en combinación con la situación real.

Para conocer los pasos y códigos detallados para la resolución de problemas, sello privado para obtener ~

Supongo que te gusta

Origin blog.csdn.net/lichensun/article/details/132392196
Recomendado
Clasificación