python从入门到放弃篇20(pandas.DataFrame)简单异常值处理

今天,事有点多,刚刚把昨天的缺失值发文补齐,现在又新学了一个简单的异常值处理方法。感觉还不错,因为最近要刷一些题应付考试。所以,得再重新对时间进行新的规划,要不然,每天就不能一篇文章了。

老规矩,上代码:
在这里插入图片描述
我们通过Pandas函数DataFrame()创建了一个7行2列的数据框,结果如下图:
在这里插入图片描述
我们现在通过
Z-Score
做简单的异常值判断。

原本python3老版本的函数找不到cols = df.columns,后来我发现我的python是新版的python,所以没有这个函数了,更新了,所以就变成了这样的:cols = df._get_cleaned_column_resolvers()。跟以前的那个函数是一样的。
在这里插入图片描述
我们通过判断是否z-score.abs() > 2.2来查找异常值。
在这里插入图片描述
然后,我们做删除操作,将带有异常值的行删除。
在这里插入图片描述
通过语句**df_drop = df[df_zscore[‘col1’] == False]**来实现。

删除后的结果显示120的那一行数据消失了。
在这里插入图片描述
最后,感谢大家前来阅读鄙人的文章,不胜感激,文中或有诸多不妥之处,还望指出和海涵。

猜你喜欢

转载自blog.csdn.net/weixin_43408020/article/details/107349790
今日推荐