机器学习概念----集成算法 - 代码天地

机器学习概念----集成算法

其他 2018-11-25 08:50:47 阅读次数: 0

集成算法（ensemble arithmetic）

集成算法包括bagging and boosting

组合bagging（并行化）

同时用多个分类器（一般是决策树）对训练集中随机样本训练，投票表决
对分类问题：将上步得到的k个模型采用投票的方式得到分类结果
对回归问题，计算上述模型的均值作为最后的结果。

代表算法：随机森林

提升boosting（序列化）

每次使用的是全部的样本，每轮训练改变样本的权重。

下一轮训练的目标是找到一个函数f来拟合上一轮的残差。当残差足够小或者达到设置的最大迭代次数则停止。

Boosting会减小在上一轮训练正确的样本的权重，增大错误样本的权重。（对的残差小，错的残差大）

AdaBoost算法
多个弱分类器串行，错误加权

GBDT（gradient boosting decision tree）
以决策树为基函数，通过负梯度来识别问题，通过计算负梯度来改进模型

GBDT方式是使用代价函数对上一轮训练出的模型函数f的偏导来拟合残差

GBDT的核心思想就是：串行训练n(n > 2)棵决策树，其中第i(1 < i ≤ n)棵树学习第i - 1棵树的负梯度（可理解为残差或增量），n棵树的输出结果累加作为最终输出结果

xgboost（extreme gradient boosting）
对损失函数做了二阶的泰勒展开，并在目标函数之外加入了正则项对整体求最优解，用以权衡目标函数的下降和模型的复杂程度，避免过拟合

bagging和boosting比较

相同之处都是用多个基分类器

不同在于他们的基分类器的关联性不同，bagging是没啥关联.并行出各自的结果.然后投票，boosting是串行.通过提升错误的权重来加强训练.达到整体最优

并且bagging是随机抽取训练集中样本进行训练，而boosting每次都是训练全部数据

bagging泛化能力强，可以平衡误差，但容易过拟合
boosting泛化能力强，错误率低，无参数调节（自行训练错误加权），但对离群点（错误）敏感

猜你喜欢

转载自blog.csdn.net/weixin_42394432/article/details/82938276

机器学习概念----集成算法

机器学习——集成算法

机器学习：集成算法

机器学习算法——集成算法（一）

机器学习原理 || 集成算法: Adaboost

机器学习集成算法：XGBoost思想

机器学习集成算法总结

机器学习：集成算法 - GBDT

【机器学习】集成算法与随机森林

机器学习9：集成算法

机器学习：集成算法概述

【机器学习】集成算法与实战案例

机器学习集成算法AdaBoost算法_20201231

数据分析与机器学习学习笔记--集成算法

【机器学习】--集成算法从初始到应用

机器学习（六）：集成算法（1）Bagging

机器学习集成算法XGBoost原理及推导

机器学习集成算法：XGBoost模型构造

机器学习入门-集成算法(bagging, boosting, stacking)

机器学习：集成算法 - bagging、boosting、adaboost

机器学习集成算法GBDT_20210111

【机器学习】集成算法:bagging策略包含详细案例

集成算法——学习笔记

传统机器学习(六)集成算法(2)—Adaboost算法原理

传统机器学习(六)集成算法(1)—随机森林算法及案例详解

【机器学习算法】三、集成算法：RF、AdaBoost、GBDT、XGBoost、LightGBM、Stacking模型融合

Python机器学习入门 - - 随机森林集成算法学习笔记

集成算法学习笔记（一）

机器学习之XGBoost集成算法、极大似然、牛顿法

Python机器学习：通过scikit-learn实现集成算法

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)