Machine Learning Techniques 笔记：2-9 Decision Tree - 代码天地

Machine Learning Techniques 笔记：2-9 Decision Tree

其他 2018-06-04 01:47:30 阅读次数: 0

g(x) 即为最终的选择

容易理解，但缺乏强有力的数学理论保障

1.首先学如何做分支

2.根据分支，分成c块，

3. 各分支学习一个各自的小树

4. 各分支整合起来，生成大树。

但只有这4个步骤，可能不行，因为没有停止的条件。

1.每次一刀切两段，只建造二元树

2. 回传一个最好的常数（二元分类，回传最多的y；回归问题，回传y的平均）

1.利用decision stump切分二元树。decision stump：在data中只看一个feature，决定完看那个feature后，就往两边切割，一边为+1，一边为-1。

CART：不断切割，到leaf时返回常数。

2.purifying：切开后，看起来比较纯的左边的dataset与右边的dataset，用最纯的切割方式作为现在的切割方法。

通过Ein 最小，来体现分类的纯度

Ein=0，可能会导致模型过复杂，容易overfit

选择一个Ein不那么大，但不会overfit的树

摘掉一片叶子的树出发，逐步增加叶子，生成不同的树，选择Ein与复杂度加权后最优的树。用validation set选择一个适合的lambada

如果体重信息缺失，可以利用其它feature，如身高做切割，切出类似的效果。一般，身高越高，体重越重

第一刀，左边非常纯净，两边各做一个子树，组成一颗大树

第二刀，对右边的子树切割，同样，左边最纯

第三刀，类似第二刀，将右边的子树的子树切割

同理，继续

切刀都很纯净

回传常数

CART：每次针对不同的决策边界做切割，可以做比较细致的切割。

看起来比Adaboost，一定要切割完全的水平/垂直刀更有效率

CART如果不做pruning，会得到low Ein，但可能会导致overfit，high Eout

猜你喜欢

转载自blog.csdn.net/f2157120/article/details/80515623

Machine Learning Techniques 笔记：2-9 Decision Tree

Machine Learning (ML) Techniques

Machine Learning Techniques 笔记：2-13 Deep Learning

Machine Learning Techniques 笔记：2-10 Random Forest

Machine Learning Techniques 笔记：2-8 Ada Boosting

Machine Learning Techniques 笔记：2-7 Blending and Bagging

Machine Learning Techniques 笔记：2-6 Support Vector Regression

Machine Learning Techniques 笔记：2-5 Kernel Logistics Regression

Machine Learning Techniques 笔记：2-15 Matrix Factorization

Machine Learning Techniques 笔记：2-16 Finale

Machine Learning Techniques 笔记：2-2 Dual Support Vector Machine

Machine Learning Techniques 笔记：2-4 Soft-Margin Support Vector Machine

Machine Learning Techniques 笔记：2-3 Kernel Support Vector Machine

Machine Learning Techniques 笔记：2-1 Linear Support Vector Machine

【Machine Learning】【Python】选择最优参数(Decision Tree, Random Forest, Adaboost, GBDT)

【Machine Learning】【Python】提取直方图特征做图片预分类(Decision Tree, Random Forest, Adaboost)

Machine Learning | (7) Scikit-learn的分类器算法-决策树(Decision Tree）

Machine Learning---9--tree regression

Machine Learning Techniques 笔记：2-14 Radial Basis Function Network

林轩田机器学习技法（Machine Learning Techniques）笔记（一）

林轩田机器学习技法（Machine Learning Techniques）笔记（五）

林轩田机器学习技法（Machine Learning Techniques）笔记（六 ~ 十六）

林轩田机器学习技法（Machine Learning Techniques）笔记（四）

林轩田机器学习技法（Machine Learning Techniques）笔记（三）

林轩田机器学习技法（Machine Learning Techniques）笔记（二）

R Unleash Machine Learning Techniques 免积分下载

Machine Learning（7）Neural network —— optimization techniques I

“Survey of machine learning techniques for malware analysis ” 个人总结

Decision tree classifier学习笔记

decision Tree

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)