Excel 的盒须图 离群值 Outliers

翻译自https://www.excel-easy.com/examples/box-whisker-plot.html
Excel 中的盒须图
本示例教您如何在Excel中创建盒须图。盒须图显示了数据集的最小值,第一四分位数,中位数,第三四分位数和最大值。

简单盒须图

  1. 例如,选择范围A1:A7。

    注意:您不必对数据点从最小到最大的顺序进行排序,但这将有助于您理解盒须图。

  2. 在“插入”选项卡上的“图表”组中,单击“统计图表”符号。

  3. 点击箱线图(盒须图)

    结果:

    说明:框的中间线代表中位数或中间数(8)。框中的x表示平均值(在此示例中也为8)。中位数将数据集分为下半部分{2,4,5}和上半部分{10,12,15}。框的底线代表下半部分或第一四分位数(4)的中位数。框的顶行代表上半部分或第三个四分位数(12)的中位数。须(垂直线)从盒子的两端延伸到最小值(2)和最大值(15)。

离群值

  1. 例如,选取范围 A1:A11.

    注意:中位数或中位数(8)将数据集分为两半:{1、2、2、4、5}和{10、12、15、18、35}。第一四分位数(Q1)是上半部分的中位数。Q1 =2。第三个四分位数(Q3)是下半部分的中位数。Q3 = 15。

  2. 在“插入”选项卡上的“图表”组中,单击“统计图表”符号。

  3. 点击箱线图(盒须图)

    结果:

    说明:四分位数间距(IQR)定义为第一四分位数与第三四分位数之间的距离。在此示例中,IQR = Q3-Q1 = 15-2 =13。如果数据点的距离超出第一个四分位数以下IQR的1.5倍(Q1- 1.5 * IQR = 2-1.5 * 13 =-17.5)或高于第三四分位数的IQR的1.5倍(Q3 + 1.5 * IQR = 15 + 1.5 * 13 = 34.5)。因此,在此示例中,35被认为是异常值。结果,顶部晶须延伸到该范围内的最大值(18)。

  4. 将最后一个数据点更改为34。

    结果:

    说明:所有数据点都在-17.5和34.5之间。结果,须扩展到最小值(2)和最大值(34)。

箱线图计算

在大多数情况下,如果不执行计算,就无法轻松确定第一四分位数和第三四分位数。

  1. 例如,在下面选择偶数个数据点

  2. 在“插入”选项卡上的“图表”组中,单击“统计图表”符号。

  3. 点击箱线图(盒须图)

    结果:

    说明:Excel使用QUARTILE.EXC函数来计算第一四分位数(Q1),第二四分位数(Q2或中位数)和第三四分位数(Q3)。此函数在两个值之间插值以计算四分位数。在此示例中,n = 8(数据点数)。

  4. Q1 =第1/4 *(n + 1)个值= 1/4 *(8 + 1)个值= 2 1/4个值= 4 + 1/4 *(5-4)= 4 1/4。您可以使用QUARTILE.EXC函数或查看盒须图来验证此数字。

  5. Q2 =第1/2 *(n + 1)个值= 1/2 *(8 + 1)个值= 4 1/2个值= 8 + 1/2 *(10-8)=9。这使得在某种意义上,中位数是中间两个数字的平均值。

  6. Q3 =第3/4 *(n + 1)个值=第3/4 *(8 + 1)个值= 6 3/4个值= 12 + 3/4 *(15-12)= 14 1/4。同样,您可以使用QUARTILE.EXC函数或查看盒须图来验证此数字。

另可参考:



猜你喜欢

转载自www.cnblogs.com/jiangleads/p/13394555.html