¿Cómo dibujar un diagrama de dispersión de categorías usando la función striplot()?

Hay muchos tipos de datos en el conjunto de datos. Además de las variables de características continuas, los más comunes son los datos categóricos, como el sexo, la educación, los pasatiempos, etc. de una persona. Estos tipos de datos no se pueden representar mediante variables continuas, y es representado por datos clasificados. Seaborn proporciona funciones de visualización especiales para datos categóricos, que se pueden dividir aproximadamente en los siguientes tres tipos:

Gráfico de dispersión de datos categóricos: swarmplot() y stripplot().

Gráficos de distribución de datos de clase: boxplot() y violinplot().

Gráficos de estimación estadística para datos categóricos: diagrama de barras() y diagrama de puntos().

A continuación, stripplot() se utiliza para dibujar diagramas de dispersión de categorías. El formato de sintaxis de la función stripplot() es el siguiente.

seaborn.stripplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, jitter=False)

Los significados de los parámetros comúnmente utilizados en las funciones anteriores son los siguientes:

(1) x, y, tono: entrada para dibujar datos de formato largo.

(2) datos: conjunto de datos utilizados para dibujar. Si x e y no están presentes, se utilizará como formato ancho; de lo contrario, se utilizará como formato largo.

(3) jitter: indica el grado de jitter (solo a lo largo del eje de categorías). Cuando muchos puntos de datos se superponen, puede especificar la cantidad de fluctuación o configurarlo en Mar para usar el valor predeterminado.

Para que todos comprendan mejor, a continuación, dibuje un diagrama de dispersión a través de la función stripplot(). El código de muestra es el siguiente.

# 获取tips数据
tips = sns.load_dataset("tips")
sns.stripplot(x="day", y="total_bill", data=tips)

Los resultados de la ejecución se muestran en la siguiente figura.

Como se puede ver en la figura anterior, las abscisas del gráfico son datos clasificados y algunos puntos de datos se superponen entre sí, lo que dificulta su observación. Para resolver este problema, puede pasar el parámetro jitter al llamar a la función striplot () para ajustar la posición de la abscisa. El código de muestra modificado es el siguiente.

sns.stripplot(x="day", y="total_bill", data=tips, jitter=True)

Los resultados de la ejecución se muestran en la siguiente figura.

Además, también se puede llamar a la función swarmplot0 para dibujar un diagrama de dispersión. La ventaja de esta función es que todos los puntos de datos no se superpondrán y la distribución de los datos se puede observar claramente. El código de muestra es el siguiente.

sns.swarmplot(x="day", y="total_bill", data=tips)

Los resultados de la ejecución se muestran en la figura.

Supongo que te gusta

Origin blog.csdn.net/zy1992As/article/details/132581003
Recomendado
Clasificación