AdaBoost算法原理详解 - 代码天地

AdaBoost算法原理详解

其他 2018-08-07 10:16:27 阅读次数: 0

Boosting提升算法

Boosting算法是将“弱学习算法”提升为“强学习算法”的过程，最具有代表性的是AdaBoost算法。Boosting提升算法思想：对于一个复杂任务来说，将多个专家的判断进行适当的综合所得出的判断，要比其中任何一个单独判断的好；相当于“三个臭皮匠顶个诸葛亮”。一般来说，提升方法就是从弱学习算法出发，反复学习，得到一系列弱分类器（基本分类器），组合这些弱分类器得到一个强分类器。

AdaBoost算法介绍

AdaBoost是Boosting方法中代表性的算法。该方法在每轮的迭代过程中降低分类正确的样例的权重，提高分类错误的样例的权重，使得分类器在迭代过程中逐步改善，最终将所有分类器线性组合得到一个强分类器。Boost算法框架如下图所示：

图1 Boost分类框架（来自PRML）

AdaBoost算法过程

(1).初始化训练数据集的权值分布，共有N个训练样例。

(2).进行M轮迭代学习，第m轮学习过程如下:

(a).使用具有权值分布Dm的训练数据集学习，得到基本分类器Gm;

(b).计算Gm在训练数据集上的分类误差率em：

(c).计算Gm的权重系数：

(d).更新训练样例的权重系数:

(e).重复(a)~(d).得到一系列的权重参数am和基分类器Gm;

(3).将上一步得到的基分类器根据权重参数线性组合，得到最终分类器：

算法中的两个权重分析

(1).关于基分类器权重的分析:

上面计算的am表示基分类器在最终的分类器中所占的权重，am的计算根据em而得到，由于每个基分类器的分类性能要好于随机分类器，故而误差率em<0.5.（对二分类问题）当em<0.5时，am>0且am随着em的减小而增大，所以，分类误差率越小的基分类器在最终的分类器中所占的权重越大。

(2).训练样例的权重分析:

根据公式可知，由于am>0，故而exp(-am)<1，当样例被基本分类器正确分类时，其权重在减小，反之权重在增大。通过增大错分样例的权重，让此样例在下一轮的分类器中被重点关注，通过这种方式，慢慢减小了分错样例数目，使得基分类器性能逐步改善。

算法中的训练误差分析

关于误差上界有以下不等式，此不等式说明了AdaBoost的训练误差是以指数的速度下降的。

AdaBoost算法推导过程

AdaBoost算法使用加法模型，损失函数为指数函数，学习算法使用的前向分布算法。

其中加法模型为:

损失函数为指数函数：

假设已经经过m-1轮迭代，得到Fm-1(x)，根据前向分步，我们可以得到：

已知AdaBoost是采用指数损失，由此可以得到损失函数：

化简之后的损失函数，接下来对损失函数求导，对am求偏导如下：

参考文献：

【1】李航，统计学习

猜你喜欢

转载自blog.csdn.net/yb1020368306/article/details/80985480

AdaBoost算法原理详解

Adaboost原理详解与算法实现

【机器学习详解】AdaBoost算法原理

机器学习 Adaboost算法原理详解

AdaBoost原理详解

Adaboost算法原理与实践

Adaboost 算法的原理与推导

Adaboost算法原理分析

机器学习笔记2：AdaBoost算法原理和推导详解

AdaBoost 算法详解

最新AdaBoost算法原理与理解

【转载】 Adaboost 算法的原理与推导

adaboost算法原理实现及理解

Adaboost 算法的原理与推导(转载)

AdaBoost从原理到算法的实现

AdaBoost算法详解与python实现

组合分类方法之AdaBoost算法实战（单层决策树原理代码详解）---机器学习

机器学习算法[7]--集成方法之AdaBoost原理详解及sklearn实现

机器学习算法（一） | Adaboost算法详解

Adaboost 算法的原理与推导（读书笔记）

集成学习之Adaboost算法原理小结

集成学习之Adaboost算法原理

机器学习原理 || 集成算法: Adaboost

Boost算法（GDBT,AdaBoost，XGBoost）原理及实践

Adaboost算法的原理和见解

提升算法AdaBoost原理以及python实现

Boosting族算法--Adaboost算法与GBDT算法原理(简单易懂)

梯度提升树(GBDT)原理小结(转载) 集成学习值Adaboost算法原理和代码小结(转载) 梯度提升树(GBDT)原理小结 GBDT原理详解

AdaBoost详解

Adaboost算法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)