Use a função boxplot para desenhar um gráfico de caixa na linguagem R

(Do Baidu, copiado aqui para facilitar a visualização, caso haja alguma infração, será deletado)

Introdução aos Boxplots

O box plot, também conhecido como box plot ou box-whisker plot, é um gráfico desenhado a partir de cinco autovalores.

Os 5 autovalores são o máximo, mínimo, mediana, 1º quartil e 3º quartil da variável.

Conecte os dois quantis para desenhar uma caixa, divida a caixa pela mediana e conecte os dois pontos extremos com a caixa para formar um box plot.

Função boxplot para desenhar box plots em R

(1) Uso básico

gráfico de caixa(x, ...)

(2) Uso do formulário de fórmula

boxplot(formula, data = NULL, ..., subset, na.action = NULL, drop = FALSE, sep = ".", lex.order = FALSE)

(3) Uso padrão

boxplot(x, ..., intervalo = 1,5, largura = NULL, varwidth = FALSE, notch = FALSE, contorno = TRUE, nomes, gráfico = TRUE, border = par("fg"), col = NULL, log = " ", pars = list(boxwex = 0.8, grampowex = 0.5, outwex = 0.5), horizontal = FALSE, add = FALSE, at = NULL)

O significado dos principais parâmetros:

x : vetor, lista ou quadro de dados.

formula: fórmula, na forma de y~grp, onde y é um vetor e grp é um agrupamento de dados, geralmente um fator.

dados: Um quadro de dados ou lista para fornecer os dados na fórmula.

range: valor, o padrão é 1.5, indicando o range dos tentáculos, ou seja, range × (Q3 - Q1)

width: A largura relativa da caixa, que é válida quando há várias caixas.

varwidth: Valor lógico, controlando a largura da caixa, só funciona quando há várias caixas na imagem, o padrão é FALSE, todas as caixas têm a mesma largura, quando seu valor é TRUE, representa o tamanho da amostra de cada caixa como sua largura relativa

notch: Valor lógico, se este parâmetro for definido como TRUE, os entalhes aparecerão em ambos os lados da caixa. O padrão é falso.

esboço: Valor lógico, se este parâmetro for definido como FALSO, nenhum outlier será desenhado no boxplot. O padrão é verdadeiro.

nomes: Os rótulos de agrupamento desenhados abaixo de cada boxplot.

plot : Valor lógico, se deseja desenhar um gráfico de caixa, se definido como FALSE, o gráfico de caixa não será desenhado, mas as informações relevantes para desenhar o gráfico de caixa, como a informação de 5 pontos, etc., serão fornecidas.

border: A cor da borda do boxplot.

col: a cor de preenchimento do boxplot.

horizontal: valor lógico, especifica se o boxplot é desenhado horizontalmente, o padrão é FALSE.

Exemplo de uso da função boxplot

(1) Uso simples

As estatísticas dos dados de altura de um aluno do ensino médio são as seguintes:

144, 166, 163, 143, 152, 169, 130, 159, 160, 175, 161, 170, 146, 159, 150, 183, 165, 146, 169

Desenhe seu boxplot.

h <- c(144,166,163,143,152,169,130,159,160,175,161,170, 146,159,150,183,165,146,169)

gráfico de caixa(h)

O resultado é mostrado na figura abaixo:

gráfico de caixa simples

(2) Boxplots de vários grupos

Uma fábrica implementa um novo método de trabalho, a eficiência de trabalho (produção por hora) do grupo experimental e do grupo de controle (método original), conforme mostrado nos seguintes dados:

Grupos de teste: 35, 41, 40, 37, 43, 32, 39, 46

Grupo de controle: 32, 39, 34, 36, 32, 38, 34, 31

Desenhe seu boxplot.

Escreva o programa R da seguinte forma:

x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31)

f <- fator(rep(c("grupo de teste","grupo de controle"), each=8)) #define o fator de agrupamento

data<- data.frame(x,f) #generate data frame

boxplot(x~f,dados)

O resultado é mostrado na figura abaixo:

Boxplot de comparação de vários grupos

(3) Uso do parâmetro de largura, parâmetro de borda e parâmetro de col

x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31)

f <- fator(rep(c("grupo de teste","grupo de controle"), cada=8))

data<- data.frame(x,f)

boxplot(x~f,data,width=c(1,2), col=c(2,3), border=c("darkray","roxo"))

Resultados conforme mostrado abaixo:

Adicionando cores a boxplots e muito mais

Como pode ser visto na figura, a largura do segundo boxplot é o dobro da primeira. A cor de cada wireframe e a cor de fundo também são diferentes. Isso é dado principalmente pelo parâmetro largura, parâmetro col e parâmetro borda.

(4) Gráfico de caixa com entalhes

x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31)

f <- fator(rep(c("grupo de teste","grupo de controle"), cada=8))

data<- data.frame(x, f)

boxplot(x~f,data,width=c(1,2), col=c(2,3), notch=TRUE)

Como mostrado abaixo:

Gráfico de caixa entalhada

Para o uso de outros parâmetros, os leitores podem testar e verificar por si mesmos de acordo com as explicações relevantes. Aqui estão apenas os métodos de uso de alguns parâmetros comumente usados. Espero que ajude você.

Se você gosta do artigo do editor, preste atenção a esta conta. O editor atualizará regularmente artigos sobre a linguagem R recentemente. Se você estiver interessado em linguagem R ou análise de dados, você pode discutir isso juntos. No futuro, este número lançará uma série de artigos sobre Python, SPSS, Excel, etc.

Acho que você gosta

Origin blog.csdn.net/weixin_45709013/article/details/122531014
Recomendado
Clasificación