离群点检测(Novelty Detection, Outlier Detenction)

适合问题: 对于无标签的数据, 又想找出坏用户,完成业务目标。

参考: https://scikit-learn.org/stable/modules/outlier_detection.html

算法:

  1. one class SVM, 原理: 特征空间中, 分割平面离原点的距离大
  2. IsolationForest , 原理: 异常点在随机分割的森林中,点到根的平均路径要比正常点小很多。
  3. 其他方差,PCA等。
  4. Local Outlier Factor, 适合给定数据集, 不能做预测。
  5. 复杂算法, https://arxiv.org/pdf/1803.01798.pdf

应用:

  1. https://gallery.azure.ai/Experiment/1219e87f8fb84e88a2e1b54256808bb3
  2. https://www.kaggle.com/dloden/credit-card-fraud-detection

猜你喜欢

转载自www.cnblogs.com/bregman/p/10006852.html