使用numpy计算数据异常值

异常值(outlier)是指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍。

import numpy as np

def function(arrayMatrix):
    arraystd=np.std(arrayMatrix,1,ddof=1)[:, np.newaxis]
    arraymean=np.mean(arrayMatrix,1)[:, np.newaxis]
    arrayoutlier=np.where(np.abs(arrayMatrix-arraymean)>(arraystd))#or 2*arraystd
    return arrayoutlier

猜你喜欢

转载自blog.51cto.com/13959448/2317264