matplotlib——箱型图

箱型图

箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,能快速识别异常值。箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。除了箱型图外,一般还可以采用直方图,散点图等进行异常值检测。箱型图的结构如下图:
在这里插入图片描述
横式箱型图
在这里插入图片描述
其中箱型图检测异常值的原则是不在-1.5IQR和1.5IQR之间的样本点认为是异常点。使用封顶法的话可以认为在第5和第95百分位数范围之外的任何值都认为是异常值,或者距离平均值为三倍标准差或者更大的数据点也可以被认为是异常值。注:由于异常值只是对有影响的特殊数据点进行检测,因此它的选择也取决于对数据,业务的理解。

绘制箱型图

import matplotlib.pyplot as plt
import numpy as np
import random


np.random.seed(100)
data = np.random.normal(size=1000, loc=0, scale=1)
plt.boxplot(data, sym='o', whis=1.5)
plt.show()

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_47166032/article/details/121317307