为什么决策树模型不考虑变量之间的共线性？ - 代码天地

为什么决策树模型不考虑变量之间的共线性？

编程语言 2018-04-24 19:11:50 阅读次数: 2

在做线性回归时，假设之一是要求自变量之间没有强共线性，但是用决策树模型做预测时，却没有这个要求。于是乎，查询了一下，在Quora上找到了相关答案。Is multicollinearity a problem with gradient boosted trees?

总结一下，主要有下面几个原因

1.在统计分析中，作推断（inference）时，如果自变量存在共线性，将无法区分它们对因变量的影响，因此无法对结果进行清除的解释。

2.但是作预测（prediction）时，我们并不关系如何解释自变量对因变量的影响。GBT 也更像一个black-box，很适合做预测分析。

3.做预测分析时，即时我们用OLS方法，如果特征存在强相关性，会导致特征矩阵不可逆，但此时，我们仍然可以利用psedoinverse matrix进行计算。

4. 做预测时，往往用贪婪算法进行变量选择，只有新变量对结果影响比较大时，才会被加入到模型中，因此，在step-wise variable selection的过程中，共线性的变量只有一个会被选入到模型中。在决策树模型中，每一个树的构建都是贪婪的，因此，冗余的特征并不会被加入模型中。

（如果理解有问题，欢迎批评指正）

猜你喜欢

转载自blog.csdn.net/u011534339/article/details/80068657

为什么决策树模型不考虑变量之间的共线性？

基因共线性

多重共线性+变量选择（钟老师）

GBDT为什么比决策树结果更优？从决策树到随机森林再到GBDT，模型是怎么优化的？

[DataAnalysis]多元线性回归深入浅出-案例+模型假设+参数估计方法+模型评判方法+变量选择+多重共线性问题

r、 weka从决策树模型看员工为什么离职？

决策树模型

什么是决策树？

基因组共线性学习

【math】共线性的影响分析

Python 多重共线性检验

多重共线性的处理方法

正在迷茫的你，为什么不考虑这份工作呢？

多变量决策树

决策树模型小结

决策树与集成模型

经典决策树模型

决策树模型介绍

决策树思维模型

【分类模型】决策树

决策树模型（二）

分类——决策树模型

统计模型----决策树

什么是决策树？（详解）

树模型与线性模型的区别决策树分类和逻辑回归分类的区别【总结】

【决策树算法】{0} —— 决策树模型简介

04 聊聊线性回归多重共线性

什么是决策树？决策树的构建

回归模型中的多重共线性 + 危害 + 原因 + 判断标准 + 解决办法，回归系数

机器学习树模型——决策树

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)