Análisis de datos de Python: visualización gráfica de datos de PMI

¡Acostúmbrate a escribir juntos! Este es el quinto día de mi participación en el "Nuevo plan diario de Nuggets · Desafío de actualización de abril", haga clic para ver los detalles del evento .

Un caballero modesto, use Dachuan.

prefacio

Los gráficos de ppi-cpiy . En este artículo, continúo compartiendo un indicador que refleja la prosperidad de las actividades económicas. En este artículo, todavía usamos el método del rastreador para obtener datos y luego usamos la herramienta de dibujo para mostrar los datos año por año. Para principiantes, aprenderá los conceptos básicos de , rastreador y conocimiento de dibujo gráfico.m0-m1-m2PMImatplotlibPMIpython

Adquisición de datos PMI

Antes de obtener los datos, hablemos PMIdel significado detrás de los datos (índice de gerentes de compras): Todos saben que la manufactura es la base de un país, por lo que PMIes un indicador para medir el desarrollo y operación de la industria manufacturera de un país. es más del 50%, es la línea divisoria de la fortaleza económica. Si es más del 50%, significa que la industria manufacturera se está expandiendo. Si es 40-50, significa recesión. Si es inferior a 40, es significa depresión.

Dado que se trata de una adquisición de datos, es necesario encontrar un sitio web autorizado para obtener datos. Aquí, el editor utiliza los datos de Oriental Fortune.com, y aquí proporciona directamente la dirección de acceso a la página:

# 货币供应量数据访问地址
https://data.eastmoney.com/cjsj/pmi.html
复制代码

Las fuentes de datos del índice de gerentes de compras se muestran en la siguiente figura. Aquí solo se pueden obtener los datos del índice de las industrias manufactureras y no manufactureras, y no se obtendrán los datos de crecimiento interanual.

Ahora que conoce la fuente del PMI, ¿cómo obtiene los datos? ¿Es necesario copiar la página en Excel para el análisis? Si lo hace, llevará mucho tiempo y trabajo. Creo que habrás notado que hay una paginación debajo de la tabla, por lo que debe haber comunicación con el fondo a través de ajax, al observar puedes encontrar la siguiente interfaz, y el resultado de la interacción de datos se muestra en la siguiente figura:

#采购经理人指数
https://datainterface.eastmoney.com/EM_DataCenter/JS.aspx?type=GJZB&sty=ZGZB&p=1&ps=200&mkt=21

# 这里也同样贴了前文中货币供应量接口、 ppi 和 cpi 的接口,会发现都是一样的,只不过mkt的参数不一样
# 货币供应量接口
https://datainterface.eastmoney.com/EM_DataCenter/JS.aspx?type=GJZB&sty=ZGZB&p=1&ps=200&mkt=11
# ppi 数据和cpi 数据
https://datainterface.eastmoney.com/EM_DataCenter/JS.aspx?type=GJZB&sty=ZGZB&p=1&ps=10&mkt=22
https://datainterface.eastmoney.com/EM_DataCenter/JS.aspx?type=GJZB&sty=ZGZB&p=1&ps=10&mkt=19
复制代码

En cuanto a la adquisición de datos, todavía se opera de manera de principio, utilizando para pythoncapturar datos, aquí se utiliza requestspara adquirir datos:

    body = requests.get(req_url).text
    body = body.replace("(", "").replace(")", "")
    data_list = body.split("\",\"")

    # 定义数据
    date_list, pmi1_list, pmi2_list = [], [], []

    for node in data_list:
        node = node.replace("]", "").replace("[", "").replace("\"", "")
        arr_list = node.split(",")
        date = arr_list[0]
        if date < "2010-01-01":
            continue
        # 时间数据
        date_list.append(date)
        # 数据操作存储
        pmi1_list.append(float(arr_list[1]))
        pmi2_list.append(float(arr_list[3]))
        print(node)

复制代码

Los datos finales obtenidos se muestran en la siguiente figura:

Dibujo de gráficos PMI

Antes de dibujar el gráfico, los datos deben procesarse:

  • 1 Los datos deben procesarse para extraer los datos que deben mostrarse, y luego el formato de los datos debe convertirse.
  • 2 Durante el procesamiento de datos, los datos se obtienen de acuerdo con la lista de industrias manufactureras y no manufactureras y el tiempo.
  • 3 Siga usando np.asarray para crear datos y prepararse para el dibujo de gráficos.

De acuerdo con el punto de vista anterior, el código de procesamiento de datos se muestra en la siguiente figura:

Para el dibujo de gráficos, existen los siguientes puntos:

  • 1 Los datos de fabricación y no fabricación deben mostrarse en el gráfico, y la leyenda debe mostrarse para su identificación.
  • 2 Establezca el indicador en 50 y 40 líneas horizontales, que se utilizan para establecer estilos de línea de contraste estándar.

Finalmente, luego de estas codificaciones, el gráfico de comparación final de los índices manufactureros y no manufactureros es el siguiente:

Resumir

En este artículo, se presenta un pythonrastreador numpysimple, se realiza un procesamiento de datos simple usando y, finalmente, se dibujan gráficos usando matplotlibpara lograr una forma intuitiva de mostrar gráficos de índice de fabricación y no fabricación. Usando el método de interfaz para obtener datos, puede obtener la actualización de datos y volver a dibujar el gráfico en cualquier momento, ahorrando el paso de la recuperación de datos.

Supongo que te gusta

Origin juejin.im/post/7082787341508542500
Recomendado
Clasificación