解决样本不均衡问题-SMOTE

其他 2019-01-13 13:17:03 阅读次数: 0

版权声明：https://blog.csdn.net/z0n1l2 https://blog.csdn.net/z0n1l2/article/details/83757696

原文链接

SMOTE: Synthetic Minority Over-sampling Technique

解决的问题

很多算法都有一个默认的假设：样本中各个类别的样本数目是均衡的，比如深度学习中几个经典网络结构直接用于不均衡数据效果会很差。本文提出的SMOTE是一种通过线性插值过采样的方法解决不均衡问题的方法。如果通过简单复制样本没有获得期望结果时，不妨试试这个方法。

伪码

输入:同一类别的所有样本 $\{S\}$ ,聚类参数K,需要新增的样本个数N
输出:新增样本 $\{S_n\}$

步骤1:K均值聚类
步骤2:以概率 $\{P\}$ 选择一个聚类C
步骤3:聚类C中随机选择两个样本 $s_1$ 和 $s_2$ ,计算新样本 $s_x=w*s_1+(1-w)*s_2$ ， $w \in (0,1)$ 内的随机数
步骤4:重复步骤2和步骤3，直至生成N和新样本

其中步骤2的概率 $\{P\}$ 有几种不同策略:
1 按聚类大小采样，聚类越大，采样率越低
2 按聚类大小采样，聚类越大，采样率越高

从样本均衡角度，策略1更合适

猜你喜欢

转载自blog.csdn.net/z0n1l2/article/details/83757696

解决样本不均衡问题-SMOTE

SMOTE 过采样，解决正负样本不均衡问题

样本不均衡问题——smote算法源码实现

解决样本不均衡问题

样本不均衡问题

如何解决训练中的样本不均衡问题

使用 WeightedRandomSampler 解决数据样本不均衡的问题

样本不均衡

样本不均衡解决办法

样本不均衡问题调研

机器学习常见问题及解决方案——正负样本不均衡

如何解决机器学习中训练样本不均衡问题

解决样本不均衡的问题-调整类权重修改交叉熵loss

对于正负样本不均衡的解决方法

正负样本不均衡的解决办法

样本不均衡常见解决方法

08 - 样本不均衡解决方案

样本不均衡及其解决办法

一文解决样本不均衡（全）

机器学习中样本不均衡的问题

【机器学习】关于样本不均衡问题

如何处理训练样本不均衡的问题

机器学习-样本不均衡问题处理

Python【图解】样本不均衡问题及采样策略

【机器学习】样本不均衡问题的处理方法

样本不均衡问题（待消化整理）

样本不均衡对模型的影响

机器学习----正负样本不均衡

机器学习——样本不均衡学习

论文阅读：Gradient Harmonized Single-stage Detector 从梯度的方向来解决样本不均衡的问题...

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)