Adaboost算法的原理和见解 - 代码天地

Adaboost算法的原理和见解

其他 2018-11-10 21:19:40 阅读次数: 0

1.Adaboost的原理

Adaboost是一种迭代算法，针对同一个训练集中的不同分类器，然后把这些弱分类器集合起来，构成一个更强的最终分类器。(Adaptive boosting)自适应增强算法，擅长处理分类问题、标签问题和回归问题，用于数据分类问题较为多见。对于分类器而言，它是基于测试过程中错误反馈调节的分类器的分类效果。

2.算法的流程

算法实际上是一个简单的弱分类算法的提升过程，通过不断的训练，从而提高数据的分类能力。具体来说，整个算法的流程可以分为3步：

1.初始化训练集的权值分布，若训练集中有N个样本，则每个样本的权值为 1/N;

2.在训练的过程中，如果某个样本被正确分类，那么在下一轮的训练中，这个样本的权值就会减小，相反，若某个样本没有被正确分类，那么在下一轮这个样本的权值就会增加，所有权值变更过的样本在下一轮中又会重新训练，不断的进行迭代下去。

3.最后是将各个训练的弱分类器组合成强分类器，根据弱分类器的误差来判断权值，若弱分类器的误差率较大，那么在最终的强分类器中，它的权值就会较小，反之，误差率较小的，那么权值就会较大。

具体流程：

给定一个训练数据集T={(x1,y1),(x2,y2),...(xN,yN)},其中的实例 x∈X，而实例空间X∈R，y属于标记集合{-1,+1},

步骤1：初始化训练数据的权值分布，每一个初始化训练样本的权值为 1/N

步骤2：不断的进行迭代，用m = 1,2,...,n，来表示迭代了多少轮

使用具有权值分布Dm的训练数据集，得到基本分类器(一般选误差率最低的阈值来作为基本分类器)

计算Gm(x)在数据训练集上的分类误差率

那么，Gm(x)的分类误差率em就是被Gm(x)误分类样本的权值之和。

接下来计算Gm(x)的系数，此系数am直接代表着这个分类器在最终分类器中的权重

这个公式一般也可以写成am=1/2ln( (1-em)/em),表示自然底数为e,可以得到当em ≤ 1/2时，am ≥ 0，am随着·em的减小而增大，即误差率越小的分类器在最终分类器中权重越大。

更新训练集中的所有权值分布，然后进行下一轮迭代中。

可以得到基本分类器Gm(x)被错误分类的样本权值增大，而正确分类的权值减小，比较侧重于较难分的样本上。

进行规范化，组成规范化因子Zm,使之成为一个概率分布

组合各个分类器：

从而得到最终分类器：

猜你喜欢

转载自blog.csdn.net/HelloMy_Future/article/details/83540877

Adaboost算法的原理和见解

算法工程师-见解。

归并算法（详细见解）

@Resource和@Autowired的见解

Http和Https的见解

ThreadLocal见解

我的见解

MQ见解

redis见解

dubbo见解

easy的见解

BMS见解

strcmp见解

指针见解

switch见解

if的使用见解

递归见解

AI见解

JVM系列见解之垃圾回收概念和算法

我目前对用Python做算法题的一些体会和见解

指针的算法——个人见解

Floyd算法之个人见解

PBFT共识算法的个人见解

Android更新Ui的几种方法和见解

rem的认识和个人见解

Android之图片压缩的方式和见解

Android的Service的基础知识和见解

谈谈DevOps和TestOps个人见解

shell基本-单引号和双引号的见解

关于JDBC入门和一些见解

今日推荐

“开源信徒”周鸿祎开源360智脑大模型

华为ensp中vrrp虚拟路由器冗余协议原理及配置命令

基于Python爬虫广东广州水酒店宾馆数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状

知识融合：知识图谱构建的关键技术

文心一言收费还是免费：全面解析其价格策略与服务价值

百万用户通话新风潮：仅需50秒，无界AI让彩铃变身短视频

【STM32项目】基于STM32多传感器融合的新型智能导盲杖设计（完整工程资料源码）

文生视频大模型Sora的复现经验

腾讯云函数计算技术：云原生架构下的Serverless与微服务新篇章

干货分享｜JumpServer 三种常见的文件传输方式效果对比

【榜单公布】2023年度征文活动已结束

周排行

Java中关于时间的操作及格式化

《HTML5与CSS3基础教程》第五章学习笔记图像

nginx下安装PHP发生问题的逐步解决

HDU-1048，The Hardest Problem Ever（字符串处理）

新一代多媒体技术与应用的部分课后题

Shader 绘制特殊图形

Oracle数据库三种备份方案

CodeForces - 983B XOR-pyramid(两次区间DP/记忆化DFS)

Python3基础语法——变量与运算符

（转载）KMP算法详解（原创）详解KMP算法

每日归档

更多

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)

2024-04-07(4)