机器学习中如何处理样本不均衡问题 - 代码天地

机器学习中如何处理样本不均衡问题

其他 2019-02-03 14:01:11 阅读次数: 0

问题所在：可以永远预测数据多的一方，准确率accuracy仍然会很高。

假定样本数目A类比B类多，且严重不平衡：

1. A类欠采样(Undersampling)

1）随机欠采样

2）A类分成若干子类，分别与B类进入ML模型

3）基于聚类的A类分割

2. B类过采样(Oversampling)

可以避免欠采样造成信息丢失，但是随机过采样采取简单复制样本的策略来增加少数类样本，这样容易产生模型过拟合的问题，即使得模型学习到的信息过于特别而不够泛化

3. B类数据合成

1）随机插值得到新样本

2）SMOTE算法

4. 代价敏感学习

降低A类权值，提高B类权值

其他方法：

1、想办法获取更多数据

2、换个评判方式（不再用准确率或误差来衡量，而是通过precision和recall计算出F1-score）

3、重组数据（重新组合不均衡数据使之均衡，最终使两者或多者的数据差不多，即最上面的方法）

4、使用其他机器学习方法（神经网络面对不均衡数据时束手无策，但决策树不会受到不均衡数据的影响）

5、修改算法

猜你喜欢

转载自blog.csdn.net/aa_JamesJones/article/details/82954217

机器学习中如何处理样本不均衡问题

如何处理训练样本不均衡的问题

机器学习-样本不均衡问题处理

【机器学习】样本不均衡问题的处理方法

机器学习中样本不均衡的问题

如何解决机器学习中训练样本不均衡问题

【机器学习】处理样本不均衡问题的方法，样本权重的处理方法及代码

机器学习——样本不均衡的处理方式

【机器学习】关于样本不均衡问题

机器学习——样本不均衡学习

机器学习----正负样本不均衡

如何解决训练中的样本不均衡问题

样本不均衡问题

机器学习-二分类SVC中的样本不均衡问题：重要参数class_weight

在分类中如何处理训练集不均衡问题

机器学习常见问题及解决方案——正负样本不均衡

如何处理深度学习中的样本不平衡问题？

样本不均衡

样本不均衡问题调研

解决样本不均衡问题-SMOTE

解决样本不均衡问题

机器学习超详细实践攻略(23)：三板斧干掉样本不均衡问题之3——通过集成学习方法解决样本不均衡

机器学习 - 如何解决不均衡样本的分类问题

如何处理样本不平衡问题

如何处理分类中的训练数据集不均衡问题

机器学习超详细实践攻略(22)：三板斧干掉样本不均衡问题之2——对正负样本设置不同权重

样本不均衡的一些处理技巧

【Pytorch基础】nn.BCEWithLogitsLoss样本不均衡的处理

【深度学习】——物体检测细节处理（NMS、样本不均衡、遮挡物体）

如何处理不均衡数据

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)