daidingdaiding——筛查数据集中的异常值

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_41185868/article/details/86382017

1)、打印出头尾部分数据,并输出每列的七个统计量。

(2)、筛查数据集中的异常值,比如非常特殊(明显)的值。

 

T1、用分位数图展示异常点

#画出数据的分布图,然后与可能的分布进行比较,判断相关的数据是否匹配。

 

 

T2、利用Pandas工具包存储打印并分析数据:能够查找出异常值。比如输出均值、标准差,四分位数、十分位数,标签M是111、R是97。

1)、列表[0.1,0.15,0.2,0.25,0.3,0.35,0.4,4] 中确定是否有异常值,显然最后一个数“4”是异常值。

2)、Pandas输出头部、尾部数据进行观察分析,Pandas可自动计算出均值、方差、分位数。

 

 

猜你喜欢

转载自blog.csdn.net/qq_41185868/article/details/86382017
今日推荐