[DataAnalysis]机器学习算法——类别不平衡问题 - 代码天地

[DataAnalysis]机器学习算法——类别不平衡问题

其他 2018-09-09 01:21:02 阅读次数: 0

类别不平衡对数据分析的影响

大部分的分类学习方法都有一个默认的假设：不同类别的训练样例数目相当。如果不同类别的训练样例数目稍有差别，通常影响不大。比如如果一个1000个样例的数据集中，有998个反例只有两个正例。那么学习方法只需要返回一个预测值斗士反例的模型则正确率就可以达到99.8%，这显然是不合理的。

类别不平衡问题定义

类别不平衡（class imblance）指分类问题中不同类别的训练样例数目差别很大的情况。

处理方法

在我们用 $y=w^Tx+b$ 对新样本进行分类的时候，事实上是在用预测出来的 $y$ 值和一个阈值进行比较，例如通常在 $y>0.5$ 的时候判别为正例，否则为反例。 $y$ 实际上表达了正例的可能性。几率 $\frac{y}{1-y}$ 则反应了正例可能性和反例可能性之比值，阈值设为0.5说明分类器认为真实正反例可能性相同。即：

若 $\frac{y}{1-y}>1$ ，则预测为正例

然而当训练集中的正、反例数目不相同时，令 $m^+$ 表示正例树木，用 $m^-$ 表示反例数目，则观测几率是 $\frac{m^+}{m^-}$ ，即：

若 $\frac{y}{1-y}>\frac{m^+}{m^-}$ ，则预测为正例

猜你喜欢

转载自blog.csdn.net/TOMOCAT/article/details/82259251

[DataAnalysis]机器学习算法——类别不平衡问题

机器学习-类别不平衡问题

机器学习中的类别不平衡问题

机器学习之类别不平衡问题 —— 采样方法

类别不平衡问题

机器学习周志华书类别不平衡问题解决办法

机器学习类别不平衡问题的解决方法——待完善

机器学习之类别不平衡问题 (3) —— 采样方法

机器学习之类别不平衡问题 —— ROC和PR曲线

机器学习之类别不平衡问题 (2) —— ROC和PR曲线

机器学习之类别不平衡问题 (1) —— 各种评估指标

机器学习分类任务中怎么解决类别不平衡问题

pytorch处理类别不平衡问题

分类中类别不平衡问题

分类类别不平衡问题

详解类别不平衡问题

《机器学习西瓜书》学习笔记——第三章_线性模型_类别不平衡问题

机器学习中的训练数据不平衡问题

机器学习中数据不平衡问题

【机器学习】解决数据不平衡问题

机器学习：类不平衡问题求解

机器学习 —— 类不平衡问题与SMOTE过采样算法

深入理解机器学习——类别不平衡学习（Imbalanced Learning）：类别不平衡分布对传统分类器性能的影响机理

深入理解机器学习——类别不平衡学习（Imbalanced Learning）：性能评价测度

深入理解机器学习——类别不平衡学习（Imbalanced Learning）：影响因素

深入理解机器学习——类别不平衡学习（Imbalanced Learning）：应用领域

深入理解机器学习——类别不平衡学习（Imbalanced Learning）：常用技术概览

深入理解机器学习——类别不平衡学习（Imbalanced Learning）：基础知识

[转]如何处理机器学习中的不平衡类别

如何处理机器学习中的不平衡类别

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)