041.（10.23）集成学习之学习策略与多样性 - 代码天地

041.（10.23）集成学习之学习策略与多样性

其他 2021-02-28 09:45:05 阅读次数: 0

集成学习之学习策略与多样性

常见学习策略

回归问题

平均法
加权平均

由于数据中样本不充分或噪声的影响，学出的权重有可能不靠谱，这时该方法未必优于普通平均法。

分类问题

绝对多数投票法

标记过半，则预测为该标记。
相对多数投票法

预测为得票最多的标记。若存在得票数目相同的标记，则随机选择一个。
加权投票法

注意，不同类型的输出值不能混用（如基学习器异质），可以看看是否有相应的转换技术。

在这里插入图片描述

学习法

当训练数据很多时，可通过另一个学习器进行结合，stacking是其中的代表。这里把用于结合的学习器称为次学习器或元学习器。

在这里插入图片描述
注意，在次级学习阶段，如果直接用初级学习器的训练集产生次级训练集，过拟合风险较大。因此，可以考虑交叉验证（如每一折中的训练集-初级，测试集-次级）、留一法等方式选取。

多样性

分歧（以回归为例）

在这里插入图片描述
集成的分歧可以体现个体学习器的差异。

误差

在这里插入图片描述

误差-分歧分解

在这里插入图片描述

（E为集成的泛化误差）

由上述公式可以看出，个体学习器准确性越高、多样性越大，集成越好。

详细推导可见：
Vincent__Lai：西瓜书集成学习的误差-分歧分解公式推导

多样性度量（一般指分类问题）

常见的多样性度量：不和度量、相关系数、Q-统计量、k-统计量

多样性增强

常见的增强方式有数据样本扰动、输入属性扰动、输出表示扰动、算法参数扰动。前两者在前面有提到过。

输出表示扰动：对输出操纵，如翻转部分分类结果，随机改变一些样本标记、对输出表示进行转化，可以是类别转化为回归，等等。
算法参数扰动：

猜你喜欢

转载自blog.csdn.net/u013598957/article/details/109280408

041.（10.23）集成学习之学习策略与多样性

物种多样性学习之Beta多样性

物种多样性学习之Alpha多样性

集成学习-多样性的度量和增强

集成学习-非成对多样性度量-个人总结

物种多样性学习 1

β多样性算法

多样性指数区别

生物多样性概念

编码标准的多样性

041.集群网络-K8S网络策略

Android的屏幕多样性支持

推荐系统多样性指标衡量

基因多样性与多态信息含量

图片的多样性之模式崩溃

Biodiversity Project ：生活多样性项目

R语言计算β多样性

大模型训练数据多样性的重要性

Alpha多样性之箱线图绘制

Alpha多样性之箱线图解读

Array对象的多样性。面试题

LiveVideoStackCon 2018展现多媒体技术生态多样性

利用metaphlan2结果计算alpha多样性

文献综述：多样性推荐算法的定义及优化方法

基尼辛普森指数衡量多样性

computer planetary——全球生物多样性信息机构 (GBIF)

兴趣探测的多样性解决方案

机器视觉软件开发的多样性

FID与LPIPS等图像质量与多样性指标

R语言实践——使用rWCVP映射多样性

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)