机器学习面试—数据不平衡

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ZK_J1994/article/details/81254100
  • 数据不平衡解决办法(上采样,容易过拟合;下采样+ensemble,计算复杂度;数据合成smote;一分类支持向量机;异常检测如聚类、基于统计的箱线图)

 

  • 对数据不平衡不敏感的评价指标(precision,recall,AUC,roc,Fbeta,F1)

 

参考文献

数据合成smote算法

异常检测—孤立森林

孤立森林

箱线图异常检测

猜你喜欢

转载自blog.csdn.net/ZK_J1994/article/details/81254100