LOF-Local Outlier Factor

摘要: Local Outlier Factor(LOF)是基于密度的经典算法(Breuning et.al. 2000), 文章发表于 SIGMOD 2000, 到目前已经有 3000+ 的引用。在 LOF 之前的异常检测算法大多是基于统计方法的,或者是借用了一些聚类算法用于异常点的识别(比如 ,DBSCAN,OPTICS)。

大神的文章:https://blog.csdn.net/wangyibo0201/article/details/51705966

1、几个基本概念

K-邻近距离(k-distance):在距离数据点 p 最近的几个点中,第 k 个最近的点跟点 p 之间的距离称为点 p 的 K-邻近距离,记为 k-distance (p) 。

可达距离(rechability distance):可达距离的定义跟K-邻近距离是相关的,给定参数k时, 数据点 p 到 数据点 o 的可达距离 reach-dist(p, o)为数据点 o 的K-邻近距离 和 数据点p与点o之间的直接距离的最大值

局部可达密度(local rechability density):局部可达密度的定义是基于可达距离的,对于数据点 p,那些跟点p的距离小于等于 k-distance(p)的数据点称为它的 k-nearest-neighbor,数据点 p 的局部可达密度为它与邻近的数据点的平均可达距离的倒数。

实际上,我们在用的时候,也只需要关注他们是到底表达了 什么含义就好

basiclly,我们知道lrd(p)   也就是表示了 p点的点的密集的程度,这样也就很轻松的分离出来了 离群点。。。。

具体  请参考上面的那个文章

猜你喜欢

转载自blog.csdn.net/weixin_42066185/article/details/81910566