数据预处理-非平衡样本的处理方式(SMOTE--待补充) - 代码天地

数据预处理-非平衡样本的处理方式(SMOTE--待补充)

其他 2020-02-20 23:01:11 阅读次数: 0

一.一般经验

1. 1:20以上是需要做均衡处理的 ,普通数据召回率低的话1:10就可以做均衡处理

2. 一般如果不是严重不平衡,或者不平衡既是业务的正常反应,则不需要做处理,非平衡样本的处理方式不是必须的

3. 多分类样本不均衡,只能过采样处理 (一般实验或比赛数据才会过采样处理, 一般不会过采样处理, 因为会有很多问题.)

二.处理方法

1. 过采样:增加少数样本的个数,容易过拟合用原始数据增加样本
2. 欠采样:减少多数样本的个数,容易丢失多数类的重要信息,容易欠拟合
3. SMOTE算法,合并少数类过采样技术 KNN近邻增加的不是原始样本也不是真实的样本

三.SMOTE-只针对二分类模型

SMOTE算法步骤：
1. 随机找一个少数类的观测点
2. 用KNN计算观测点最近的样本
3. 随机挑选离观测点近邻的其中一个样本
4. 计算两点的差值后进行随机提取。所以这里的随机体现在两个方面，线性体现在求差值的运算上面。

# pip install imblearn

猜你喜欢

转载自www.cnblogs.com/jing-yan/p/12337912.html

数据预处理-非平衡样本的处理方式(SMOTE--待补充)

处理非平衡数据集——SMOTE算法

数据预处理：样本非平衡处理

机器学习︱非平衡数据处理方式与评估

Spark -- Spark的smote算法，非平衡数据处理示例

非平衡数据处理SMOTE的改良算法-borderline SMOTE, ADASYN

ML常用数据预处理方式

数据不平衡处理方式

数据不平衡处理----smote算法

python数据预处理方式 :数据降维

四种数据预处理方式的区别?

不均衡样本的处理方式

解决非平衡的数据处理方式

机器学习中不平衡数据的处理方式

python数据预处理之数据标准化的几种处理方式

python数据预处理时缺失值的不同处理方式！

深度学习训练中关于数据处理方式--原始样本采集以及数据增广

机器学习——样本不均衡的处理方式

非平衡数据的处理方法

数据处理三数据类别平衡（难易样本平衡）

数据预处理方式（去均值、归一化、PCA降维）

[机器学习与深度学习] - No.6 ImageNet数据集预处理方式

一种通用的图像预处理方式

数据处理过采样与欠采样 SMOTE与随机采样达到样本均衡化

机器学习数据不平衡处理之SMOTE算法实现

纵表的数据处理方式

业务相关的数据处理方式

oracle大数据处理方式

后台查询数据过慢处理方式

数据处理方式总结

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)