数据挖掘面试题之SMOTE算法 - 代码天地

数据挖掘面试题之SMOTE算法

其他 2020-03-10 10:39:46 阅读次数: 0

为了解决数据的非平衡问题， 2002 年 Chawla 提出了 SMOTE 算法，即合成少数过采样技

术，它是基于随机过采样算法的一种改进方案。该技术是目前处理非平衡数据的常用手段，并

受到学术界和工业界的一致认同，接下来简单描述一下该算法的理论思想。

SMOTE 算法的基本思想就是对少数类别样本进行分析和模拟，并将人工模拟的新样本添

加到数据集中，进而使原始数据中的类别不再严重失衡。该算法的模拟过程采用了 KNN 技术，

模拟生成新样本的步骤如下：

（ 1 ）采样最邻近算法，计算出每个少数类样本的 K 个近邻。

（ 2 ）从 K 个近邻中随机挑选 N 个样本进行随机线性插值。

（ 3 ）构造新的少数类样本。

（ 4 ）将新样本与原数据合成，产生新的训练集。

发布了86 篇原创文章 · 获赞 1 · 访问量 8204

私信关注

猜你喜欢

转载自blog.csdn.net/a1272899331/article/details/104757098

数据挖掘面试题之SMOTE算法

数据挖掘面试题之blending

数据挖掘面试题之xgboost

数据挖掘面试题之gbdt

数据挖掘面试题

机器学习/数据挖掘/算法岗位面试题汇总

数据挖掘面试题之梯度提升树

数据挖掘面试题之GBDT构建新特征

数据挖掘面试题之随机森林（RF）

数据挖掘面试题之决策树

数据挖掘面试题之朴素贝叶斯

数据挖掘面试题总结(转)

数据挖掘面试题（1）

数据挖掘面试题（2）

数据挖掘150道面试题

面试题之算法

Android面试题详解之算法和数据结构面试题汇总

基础面试题之数据结构与算法

iOS之数据结构与算法面试题2

面试题之算法面试题（一）

机器学习数据挖掘常见面试题,

PHP 之算法面试题

PHP面试题之算法解析

PHP 之算法面试题（一）

大数据算法面试题

大数据算法岗位面试题

数据结构与算法面试题

面试题-数据结构算法

过采样算法之SMOTE

算法面试题

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)