Como desenhar um gráfico de dispersão categórico usando a função striplot()?

Existem muitos tipos de dados no conjunto de dados. Além das variáveis ​​​​de características contínuas, o tipo mais comum de dados são dados categóricos, como gênero, educação, hobbies, etc. Esses tipos de dados não podem ser representados por variáveis ​​contínuas. É representado por dados classificados. Seaborn fornece funções especiais de visualização para dados categóricos, que podem ser divididos aproximadamente nos três tipos a seguir:

Gráficos de dispersão para dados categóricos: swarmplot() e stripplot().

Gráficos de distribuição para dados de classe: boxplot() e violinplot().

Gráficos de estimativa estatística para dados categóricos: barplot() e pointplot().

Em seguida, use stripplot() para desenhar gráficos de dispersão de categorias. A sintaxe da função stripplot() é a seguinte.

seaborn.stripplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, jitter=False)

Os significados dos parâmetros comumente usados ​​nas funções acima são os seguintes:

(1) x, y, matiz: Entrada para plotar dados de formato longo.

(2) dados: conjunto de dados usado para desenho. Se x e y estiverem ausentes, estará em formato largo, caso contrário, estará em formato longo.

(3) jitter: Indica o grau de jitter (somente ao longo do eixo da categoria). Quando muitos pontos de dados se sobrepõem, a quantidade de jitter pode ser especificada ou definida como Terça para usar o padrão.

Para que todos entendam melhor, a seguir desenhe um gráfico de dispersão por meio da função stripplot(), o código de exemplo é o seguinte.

# 获取tips数据
tips = sns.load_dataset("tips")
sns.stripplot(x="day", y="total_bill", data=tips)

Os resultados da execução são mostrados na figura abaixo.

Como pode ser visto na figura acima, a abcissa no gráfico é um dado classificado, e alguns pontos de dados se sobrepõem, o que não é fácil de observar. Para resolver este problema, você pode passar o parâmetro jitter ao chamar a função striplot() para ajustar a posição da abcissa. O código de exemplo modificado é o seguinte.

sns.stripplot(x="day", y="total_bill", data=tips, jitter=True)

Os resultados da execução são mostrados na figura abaixo.

Além disso, a função swarmplot0 também pode ser chamada para desenhar um gráfico de dispersão. A vantagem desta função é que todos os pontos de dados não se sobrepõem e a distribuição dos dados pode ser claramente observada. O código de exemplo é o seguinte.

sns.swarmplot(x="day", y="total_bill", data=tips)

Os resultados da execução são mostrados na figura.

Acho que você gosta

Origin blog.csdn.net/zy1992As/article/details/132581003
Recomendado
Clasificación