深入理解Adaboost算法 - 代码天地

深入理解Adaboost算法

其他 2018-07-02 09:59:29 阅读次数: 0

理解算法确实是欲速则不达，唯有一步一步慢慢看懂，然后突然觉得写的真的太好了，那才是真的有所理解了。

Adaboost的两点关键点：

1. 如何根据弱模型的表现更新训练集的权重；

2. 如何根据弱模型的表现决定弱模型的话语权

算法步骤：

从训练数据中训练出一系列的弱分类器，然后把这些弱分类器集成为一个强分类器，这里并没有继续对强分类器继续合成。

给定一个训练数据集T={(x1,y1), (x2,y2)…(xN,yN)}，其中实例 $x \in \mathcal{X}$ ，而实例空间 $\mathcal{X} \subset \mathbb{R}^n$ ，yi属于标记集合{-1,+1}，Adaboost的目的就是从训练数据中学习一系列弱分类器或基本分类器，然后将这些弱分类器组合成一个强分类器。

Adaboost的算法流程如下：

步骤1. 首先，初始化训练数据的权值分布。每一个训练样本最开始时都被赋予相同的权值：1/N。

步骤2. 进行多轮迭代，用m = 1,2, ..., M表示迭代的第多少轮

a. 使用具有权值分布Dm的训练数据集学习，得到基本分类器（选取让误差率最低的阈值来设计基本分类器）：

b. 计算Gm(x)在训练数据集上的分类误差率

由上述式子可知，Gm(x)在训练数据集上的误差率em就是被Gm(x)误分类样本的权值之和。

c. 计算Gm(x)的系数，am表示Gm(x)在最终分类器中的重要程度（目的：得到基本分类器在最终分类器中所占的权重）：

由上述式子可知，em <= 1/2时，am >= 0，且am随着em的减小而增大，意味着分类误差率越小的基本分类器在最终分类器中的作用越大。

d. 更新训练数据集的权值分布（目的：得到样本的新的权值分布），用于下一轮迭代

使得被基本分类器Gm(x)误分类样本的权值增大，而被正确分类样本的权值减小。就这样，通过这样的方式，AdaBoost方法能“重点关注”或“聚焦于”那些较难分的样本上。

其中，Zm是规范化因子，使得Dm+1成为一个概率分布：

步骤3. 组合各个弱分类器

从而得到最终分类器，如下：

猜你喜欢

转载自www.cnblogs.com/zenan/p/9223741.html

深入理解Adaboost算法

EM算法的深入理解

深入理解排序算法

深入理解递归算法

深入理解KMP算法

深入理解wmd算法

冒泡算法的深入理解

深入理解floyd算法

深入理解BM算法

Adaboost算法的初步理解

理解AdaBoost算法

AdaBoost算法的理解

KMP算法next数组的深入理解

深入理解java垃圾回收算法

深入理解 hashcode 和 hash 算法

深入理解Lucene默认打分算法

Lightgbm 直方图优化算法深入理解

【深入理解JVM】：垃圾收集算法

深入理解CAS算法原理

深入理解 Dijkstra 算法实现原理

快排算法的深入理解

深入理解GBDT多分类算法

深入理解GBDT回归算法

深入理解区块链共识算法

深入理解PBFT算法的提交阶段

深入理解负载均衡原理及算法

机器学习算法：UMAP 深入理解

最新AdaBoost算法原理与理解

adaboost算法原理实现及理解

简明理解AdaBoost算法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)