适合问题: 对于无标签的数据, 又想找出坏用户,完成业务目标。
参考: https://scikit-learn.org/stable/modules/outlier_detection.html
算法:
- one class SVM, 原理: 特征空间中, 分割平面离原点的距离大
- IsolationForest , 原理: 异常点在随机分割的森林中,点到根的平均路径要比正常点小很多。
- 其他方差,PCA等。
- Local Outlier Factor, 适合给定数据集, 不能做预测。
- 复杂算法, https://arxiv.org/pdf/1803.01798.pdf
应用: