处理不平衡数据的基本方法 - 代码天地

处理不平衡数据的基本方法

其他 2019-05-03 17:11:25 阅读次数: 0

原文地址：https://www.jianshu.com/p/53bffd95d6f5

使用正确的评价指标
如ROC-AUC。
重新采样训练集
- 欠采样
  常常当数据量足够多时使用这个方法。通过在多数类样本中随机选择和少数类样本相同数量的样本。
  可多次放回地抽取不同的训练集，训练不同的分类器进行组合，会减少信息的损失。
- 过采样
  常常当数据量不足时会使用这个方法。通过重复、bootstrap或SMOTE数据合成等方法生成新的数据。运气好的话能分对很多，否则会分错很多。可在每次生成新数据点的时候加入轻微的随机扰动。

有时，结合使用欠采样和过采样也会有很好的效果。采样的优点是简单；缺点是过采样会反复出现一些样本，可能会出现一定程度的过拟合；欠采样会丢失数据，只学到了总体模式的一部分。

修改算法
比如修改模型中的代价函数部分，使得代价函数中分错少数类样本的惩罚权重大于分错多数类样本的惩罚权重。
或者使用其他的机器学习方法，神经网络算法通常对不平衡数据很无奈。

猜你喜欢

转载自www.cnblogs.com/cherrychenlee/p/10805596.html

处理不平衡数据的基本方法

不平衡数据集处理方法

处理数据不平衡方法

处理数据不平衡

处理不平衡数据的常用采样方法

机器学习之不平衡数据集的处理方法

用R处理不平衡的数据

数据不平衡处理----smote算法

不平衡数据集的处理

不平衡数据处理-imblearn

不平衡数据处理

数据不平衡处理方式

数据不平衡

不平衡样本的处理

数据挖掘：数据清洗——数据不平衡处理

不平衡数据分类

数据不平衡问题

数据预处理--克服数据不平衡

机器学习任务中，数据不平衡问题处理方法

用R语言实现对不平衡数据的四种处理方法

机器学习：正负样本数据量不平衡处理方法

使用imbalanced-learn的SMOTEN方法进行数据上采样处理不平衡问题

正负样本不平衡处理方法总结

正负样本不平衡处理方法总结【转】

机器学习中样本不平衡的处理方法

不平衡样本的处理方法---金融欺诈案例

过采样（处理数据不平衡问题）

下采样（处理数据不平衡问题）

机器学习中不平衡数据的处理方式

6个策略处理不平衡数据

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)