Machine Learning | (7) Scikit-learn的分类器算法-决策树(Decision Tree） - 代码天地

Machine Learning | (7) Scikit-learn的分类器算法-决策树(Decision Tree）

其他 2020-02-14 11:09:01 阅读次数: 0

Machine Learning | 机器学习简介

Machine Learning | (1) Scikit-learn与特征工程

Machine Learning | (2) sklearn数据集与机器学习组成

Machine Learning | (3) Scikit-learn的分类器算法-k-近邻

Machine Learning | (4) Scikit-learn的分类器算法-逻辑回归

Machine Learning | (5) Scikit-learn的分类器算法-朴素贝叶斯

Machine Learning | (6) Scikit-learn的分类器算法-性能评估

Machine Learning | (7) Scikit-learn的分类器算法-决策树(Decision Tree）

Machine Learning | (8) Scikit-learn的分类器算法-随机森林（Random Forest）

决策树(Decision Tree）

决策树(Decision Tree）是一种基本的分类方法，当然也可以用于回归。我们一般只讨论用于分类的决策树。决策树模型呈树形结构。在分类问题中，表示基于特征对实例进行分类的过程，它可以认为是if-then规则的集合。在决策树的结构中，每一个实例都被一条路径或者一条规则所覆盖。通常决策树学习包括三个步骤：特征选择、决策树的生成和决策树的修剪

优点：计算复杂度不高，输出结果易于理解，对中间值的缺失不敏感，可以处理逻辑回归等不能解决的非线性特征数据

缺点：可能产生过度匹配问题

适用数据类型：数值型和标称型

特征选择

特征选择在于选取对训练数据具有分类能力的特征。这样可以提高决策树学习的效率，如果利用一个特征进行分类的结果与随机分类的结果没有很大差别，则称这个特征是没有分类能力的。经验上扔掉这样的特征对决策树学习的京都影响不大。通常特征选择的准则是信息增益，这是个数学概念。

决策树优缺点分析

决策树的一些优点是：

简单的理解和解释。树木可视化。
需要很少的数据准备。其他技术通常需要数据归一化，需要创建虚拟变量，并删除空值。但请注意，此模块不支持缺少值。
使用树的成本（即，预测数据）在用于训练树的数据点的数量上是对数的。

决策树的缺点包括：

决策树学习者可以创建不能很好地推广数据的过于复杂的树。这被称为过拟合。修剪（目前不支持）的机制，设置叶节点所需的最小采样数或设置树的最大深度是避免此问题的必要条件。
决策树可能不稳定，因为数据的小变化可能会导致完全不同的树被生成。通过使用合奏中的决策树来减轻这个问题。

qq2648008726 博客专家

发布了274 篇原创文章 · 获赞 453 · 访问量 40万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/u012325865/article/details/104301183

Machine Learning | (7) Scikit-learn的分类器算法-决策树(Decision Tree）

scikit-learn的决策树decision tree的用法

Machine Learning | (8) Scikit-learn的分类器算法-随机森林（Random Forest）

Machine Learning | (5) Scikit-learn的分类器算法-朴素贝叶斯

Machine Learning | (3) Scikit-learn的分类器算法-k-近邻

Machine Learning | (6) Scikit-learn的分类器算法-性能评估

Machine Learning | (4) Scikit-learn的分类器算法-逻辑回归

机器学习之决策树 Decision Tree（三）scikit-learn算法库

决策树（decision tree）算法的应用（Python scikit-learn库）

Machine Learning Techniques 笔记：2-9 Decision Tree

machine learning 决策树

Machine Learning 25 -- Scikit-learn的算法选择路径

《Machine Learning by scikit-learn：Algorithms and Practices》learning note

决策树(Decision tree)基本原理与基于scikit-learn的实现

【Machine Learning】【Python】提取直方图特征做图片预分类(Decision Tree, Random Forest, Adaboost)

Machine Learning---7--regression

Machine Learning(week 7~11)

Start Learn Machine Learning

Machine Learning---9--tree regression

[Machine Learning] 分类（Classification）

Machine Learning分类

[Machine Learning with Python] Data Preparation by Pandas and Scikit-Learn

Machine Learning | (1) Scikit-learn与特征工程

【Machine Learning】【Python】选择最优参数(Decision Tree, Random Forest, Adaboost, GBDT)

《Machine Learning Yearning》第7章

Angrew Machine Learning ex7

Machine Learning（7）Neural network —— Perceptrons

7 Exciting Uses of Machine Learning in FinTech

Machine Learning Andrew Ng -7. Regularization

machine learning _基本分类

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)