R语言中绘制箱形图的替代品:蜂群图和小提琴图

原文链接:http://tecdat.cn/?p=11073

箱形图  非常有用,因为它们不仅指示中间值,而且还显示了第一四分位数和第三四分位数的测量结果变化。但是,也有一些图提供了一些附加信息。在这里,我们将仔细研究箱形图的潜在替代方案:蜂群图和小提琴图。

 蜂群图

原则上,蜂群图类似于一维散点图,因为它将单个测量结果显示为点。但是,不同之处在于,蜂群图采用了一种逻辑,以确保所绘制的点彼此靠近且不会重叠。

那么,什么时候应该使用蜂群图?由于蜂群图中的点不应重叠,因此此类图仅适用于相对少量的测量。如果测量结果显示不同的组,则它们也适用,因为各个点可以相应地着色。

在R中使用蜂群图

我们将使用  warpbreaks数据集  来举例说明绘图的用法。

 
# option 1: color by group
beeswarm(breaks ~ wool + tension, data = warpbreaks,
    main = "Beeswarm of breaks versus wool and tension",
    col = rep(c("red", "blue"), 3))

# option 2: color individual points
 

蜂群图也可以通过以下方式与箱形图组合:

 
beeswarm(breaks ~ wool, data = warpbreaks,
    main = "Beeswarm of breaks versus wool", add = TRUE,
    pwcol = as.numeric(tension), pch = 16)
 

小提琴图

小提琴图的想法是将箱形图和密度图结合起来。由于该图依赖于密度估计,因此只有在有足够数量的数据可用于获得可靠估计时,该图才有意义。否则,估计的密度可能表示数据中实际上没有的趋势。

在R中创建小提琴图

为了演示小提琴图与箱形图的不同之处,请比较以下两种表示形式:

 
grid.arrange(p.violin, p.box, ncol = 2)

   在这种情况下,我们看到了小提琴情节的限制,对于小样本量 。 另一方面,箱形图显示,实际上只有两个测量值大于60。

如果您有任何疑问,请在下面发表评论。 

大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务

统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服

点击这里给我发消息QQ:3025393450

​QQ交流群:186388004 

【服务场景】  

科研项目; 公司项目外包;线上线下一对一培训;数据爬虫采集;学术研究;报告撰写;市场调查。

【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询

欢迎关注微信公众号,了解更多数据干货资讯!
 
 

欢迎选修我们的R语言数据分析挖掘必知必会课程!

猜你喜欢

转载自www.cnblogs.com/tecdat/p/12336728.html