Minería de datos para principiantes: exploración de datos (3): análisis comparativo de análisis de características de datos

1. Análisis comparativo:

El análisis comparativo consiste en comparar dos indicadores interrelacionados para mostrar y explicar cuantitativamente si las diversas relaciones del objeto de investigación (escala, nivel, velocidad, etc.) están coordinadas. Analice las diferencias para revelar el desarrollo y los cambios que representan estas cosas y la ley del cambio.

2. Principios del análisis comparativo:

  1. Los objetos de comparación son similares : cuanto más similares son los objetos de comparación, más comparables.
  2. El índice de comparación es homogéneo

3. Características del análisis comparativo:

  • Simple : en comparación con otros análisis, el análisis comparativo tiene menos pasos operativos y no se requieren cálculos complicados.
  • Intuitivo : se refiere a la capacidad de ver directamente los cambios o brechas en las cosas, y es muy obvio conocer los mismos o diferentes datos de comparación.
  • Cuantificación : se refiere a la capacidad de mostrar con precisión cuánto es el cambio o la brecha, y luego subdividir para encontrar la causa en función del valor de medición del cambio o la brecha.

Cuatro, análisis comparativo y clasificación.

1. Comparación de números absolutos

Use números absolutos para comparar y encontrar una manera de encontrar diferencias.

2. Comparación de números relativos

Comparando y calculando por dos indicadores relacionados , es un indicador integral que se utiliza para reflejar el grado de conexión cuantitativa entre los fenómenos objetivos, y su valor se expresa como un número relativo.
Los números relativos se pueden dividir en los siguientes tipos:

  1. Número relativo de estructura: compara parte de los valores en una misma población con todos los valores para obtener la proporción , que se utiliza para ilustrar la naturaleza, estructura o calidad de las cosas.
  2. Número relativo de proporciones: compare los valores de diferentes partes de la misma población para mostrar la relación proporcional de cada parte de la población.
  3. Comparación de números relativos: compare dos valores de índice de la misma naturaleza en el mismo período para ilustrar la relación cuantitativa de objetos similares en diferentes condiciones espaciales.
  4. Número relativo de intensidad: Comparación de dos indicadores totales con propiedades diferentes pero con ciertas conexiones para ilustrar la intensidad, densidad y universalidad del fenómeno.
  5. Número relativo del nivel de finalización planificado: compare el número de finalización real y el número planificado en un período determinado para ilustrar el nivel de finalización del plan.
  6. Números relativos dinámicos: compare los valores del índice del mismo fenómeno en diferentes períodos para ilustrar la dirección del desarrollo y la velocidad del cambio.

Cinco, ejemplos

1. Número relativo dinámico
Datos de ventas existentes de cada plato:
enlace: https://pan.baidu.com/s/1cWn6JmnmwZUDQ7bgv7_V-A
código de extracción: 2677

Y los datos de ventas del departamento B:
enlace: https://pan.baidu.com/s/1b3TXAq_9qjziy8RCRiA9xw
código de extracción: 2677

Algunos ejemplos de datos:
Inserte la descripción de la imagen aquí

Ahora analice la tendencia del monto de ventas de cada departamento a lo largo del tiempo:

# 不同部门在各月份的销售对比情况
# 部门之间销售金额比较
import pandas as pd
import matplotlib.pyplot as plt
data=pd.read_excel("./data/dish_sale.xls") #读入数据
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号
plt.figure(figsize=(8, 4))
plt.plot(data['月份'], data['A部门'], color='green', label='A部门',marker='o') #绘制A部门曲线
plt.plot(data['月份'], data['B部门'], color='red', label='B部门',marker='s') #绘制B部门曲线
plt.plot(data['月份'], data['C部门'],  color='skyblue', label='C部门',marker='x') #绘制C部门曲线
plt.legend() # 显示图例
plt.ylabel('销售额(万元)')
plt.show()

Inserte la descripción de la imagen aquí

#  B部门各年份之间销售金额的比较
data=pd.read_excel("./data/dish_sale_b.xls")
plt.figure(figsize=(8, 4))
plt.plot(data['月份'], data['2012年'], color='green', label='2012年',marker='o')
plt.plot(data['月份'], data['2013年'], color='red', label='2013年',marker='s')
plt.plot(data['月份'], data['2014年'],  color='skyblue', label='2014年',marker='x')
plt.legend() # 显示图例
plt.ylabel('销售额(万元)')
plt.show()

Inserte la descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/qq_45154565/article/details/109303430
Recomendado
Clasificación