随机森林为何要有放回抽样

其他 2019-12-25 09:34:45 阅读次数: 0

最近的一次面试经历中，有被问到过随机森林为什么要用有放回的随机采样。平时的自己确实没有去仔细想过这些问题，所以最终惨淡而归。

好了，回到正题吧，随机森林是可以降低模型的方差，这里借鉴了下其它同学的回答，记录一下。

1. 如果不放回抽样，那么每棵树用的样本完全不同，基学习器之间的相似性小，投票结果差，模型偏差大；

2. 如果不抽样，那么基学习器用所有样本训练，基学习器太相似差异性太小，模型的泛化性就很差；

3. 为什么不随机抽样？这里自助采样可以产生一部分袋外样本，可以用来做袋外估计；另外自助采样一定程度上改变了每个基学习器所用数据的样本分布，一定程度上引入了噪音，增加了模型的泛化能力。

猜你喜欢

转载自www.cnblogs.com/MaiYatang/p/12094856.html

随机森林为何要有放回抽样

随机森林为何要有放回抽样？

依概率不放回随机抽样算法

不放回抽样

浅谈Service层为何要有接口

随机森林构造有哪些步骤？随机森林构造案例

随机森林算法（有监督学习）

hive 随机抽样

随机抽样

[Python] 随机抽样

抽样随机算法

Pytorch 随机抽样

随机森林

随机森林--

R——sample（）——随机抽样

task 7 随机抽样

随机抽样类型汇总

随机森林为什么要不适用所有特征

随机森林和神经网络有什么区别？

放不放回、有序无序

为何一定要有自己的博客如何选择平台

初学Python：self和__init__的含义+为何要有self和__init__

电路板上为何要有孔洞？何谓PTH/NPTH/vias(导通孔)

为何我们需要有基于上下文的语音解析

随机抽样、分层抽样、整群抽样、系统抽样的区别

sklearn的系统学习——随机森林分类器与随机森林回归器（含有python完整代码及案例）

[总结]随机抽样与蓄水池抽样问题

R语言随机抽样及分层抽样

随机森林小结

随机森林及GBDT

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)