时间序列的异常值处理

问题描述:开盘价的日收益率出现了异常值,9000多倍,什么原因导致?

答案:如图所示:由于开盘价出现了异常,价格为0.01;导致以此价格为基础计算的相关指标均异常;如果要还原真值,如果用均值与中位数均不合理,个人有两个方案还原,方案一、前后的值取中间值,即前一个开盘价格与后一个开盘价格的均值;方案二、由于开盘价与收盘价相关性非常强,且正相关,补值的价格=当日收盘价格/昨日收盘价*昨日开盘价

 结论:替换异常值或缺失值在时间序列数据中,由于特征值取值具有连续性,所以用附近的数据计算补充有更好的效果,比均值和中位数效果要好;补值的根本是要尽可能接近真实值;

进一步分析发现:

 

 

查看类似开盘价格与收盘价格的异常,如图用图形显示的话,直接画出走势图,更直接了当,效果更好;

仅管该值是真实情况出现的,但由于样例过少,本人仍然觉得替换掉效果较好,可使用前后值均值计算得出;

猜你喜欢

转载自blog.csdn.net/ningyanggege/article/details/85070542