(Do Baidu, copiado aqui para facilitar a visualização, caso haja alguma infração, será deletado)
Introdução aos Boxplots
O box plot, também conhecido como box plot ou box-whisker plot, é um gráfico desenhado a partir de cinco autovalores.
Os 5 autovalores são o máximo, mínimo, mediana, 1º quartil e 3º quartil da variável.
Conecte os dois quantis para desenhar uma caixa, divida a caixa pela mediana e conecte os dois pontos extremos com a caixa para formar um box plot.
Função boxplot para desenhar box plots em R
(1) Uso básico
gráfico de caixa(x, ...)
(2) Uso do formulário de fórmula
boxplot(formula, data = NULL, ..., subset, na.action = NULL, drop = FALSE, sep = ".", lex.order = FALSE)
(3) Uso padrão
boxplot(x, ..., intervalo = 1,5, largura = NULL, varwidth = FALSE, notch = FALSE, contorno = TRUE, nomes, gráfico = TRUE, border = par("fg"), col = NULL, log = " ", pars = list(boxwex = 0.8, grampowex = 0.5, outwex = 0.5), horizontal = FALSE, add = FALSE, at = NULL)
O significado dos principais parâmetros:
x : vetor, lista ou quadro de dados.
formula: fórmula, na forma de y~grp, onde y é um vetor e grp é um agrupamento de dados, geralmente um fator.
dados: Um quadro de dados ou lista para fornecer os dados na fórmula.
range: valor, o padrão é 1.5, indicando o range dos tentáculos, ou seja, range × (Q3 - Q1)
width: A largura relativa da caixa, que é válida quando há várias caixas.
varwidth: Valor lógico, controlando a largura da caixa, só funciona quando há várias caixas na imagem, o padrão é FALSE, todas as caixas têm a mesma largura, quando seu valor é TRUE, representa o tamanho da amostra de cada caixa como sua largura relativa
notch: Valor lógico, se este parâmetro for definido como TRUE, os entalhes aparecerão em ambos os lados da caixa. O padrão é falso.
esboço: Valor lógico, se este parâmetro for definido como FALSO, nenhum outlier será desenhado no boxplot. O padrão é verdadeiro.
nomes: Os rótulos de agrupamento desenhados abaixo de cada boxplot.
plot : Valor lógico, se deseja desenhar um gráfico de caixa, se definido como FALSE, o gráfico de caixa não será desenhado, mas as informações relevantes para desenhar o gráfico de caixa, como a informação de 5 pontos, etc., serão fornecidas.
border: A cor da borda do boxplot.
col: a cor de preenchimento do boxplot.
horizontal: valor lógico, especifica se o boxplot é desenhado horizontalmente, o padrão é FALSE.
Exemplo de uso da função boxplot
(1) Uso simples
As estatísticas dos dados de altura de um aluno do ensino médio são as seguintes:
144, 166, 163, 143, 152, 169, 130, 159, 160, 175, 161, 170, 146, 159, 150, 183, 165, 146, 169
Desenhe seu boxplot.
h <- c(144,166,163,143,152,169,130,159,160,175,161,170, 146,159,150,183,165,146,169)
gráfico de caixa(h)
O resultado é mostrado na figura abaixo:
gráfico de caixa simples
(2) Boxplots de vários grupos
Uma fábrica implementa um novo método de trabalho, a eficiência de trabalho (produção por hora) do grupo experimental e do grupo de controle (método original), conforme mostrado nos seguintes dados:
Grupos de teste: 35, 41, 40, 37, 43, 32, 39, 46
Grupo de controle: 32, 39, 34, 36, 32, 38, 34, 31
Desenhe seu boxplot.
Escreva o programa R da seguinte forma:
x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31)
f <- fator(rep(c("grupo de teste","grupo de controle"), each=8)) #define o fator de agrupamento
data<- data.frame(x,f) #generate data frame
boxplot(x~f,dados)
O resultado é mostrado na figura abaixo:
Boxplot de comparação de vários grupos
(3) Uso do parâmetro de largura, parâmetro de borda e parâmetro de col
x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31)
f <- fator(rep(c("grupo de teste","grupo de controle"), cada=8))
data<- data.frame(x,f)
boxplot(x~f,data,width=c(1,2), col=c(2,3), border=c("darkray","roxo"))
Resultados conforme mostrado abaixo:
Adicionando cores a boxplots e muito mais
Como pode ser visto na figura, a largura do segundo boxplot é o dobro da primeira. A cor de cada wireframe e a cor de fundo também são diferentes. Isso é dado principalmente pelo parâmetro largura, parâmetro col e parâmetro borda.
(4) Gráfico de caixa com entalhes
x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31)
f <- fator(rep(c("grupo de teste","grupo de controle"), cada=8))
data<- data.frame(x, f)
boxplot(x~f,data,width=c(1,2), col=c(2,3), notch=TRUE)
Como mostrado abaixo:
Gráfico de caixa entalhada
Para o uso de outros parâmetros, os leitores podem testar e verificar por si mesmos de acordo com as explicações relevantes. Aqui estão apenas os métodos de uso de alguns parâmetros comumente usados. Espero que ajude você.
Se você gosta do artigo do editor, preste atenção a esta conta. O editor atualizará regularmente artigos sobre a linguagem R recentemente. Se você estiver interessado em linguagem R ou análise de dados, você pode discutir isso juntos. No futuro, este número lançará uma série de artigos sobre Python, SPSS, Excel, etc.