1.决策树:
优点: 直观,便于理解,小规模数据集有效
缺点: 处理连续变量不好类别较多时,错误增加的比较快,可规模性一般
2.决策树的应用:
python的机器学习的库:scikit-learn
特性:
简单高效的数据挖掘和机器学习分析
对所有用户开放,根据不同需求高度可重用性
基于Numpy, SciPy和matplotlib
开源,商用级别:获得 BSD许可
使用用scikit-learn
安装scikit-learn: pip, easy_install, windows installer
安装必要package:numpy, SciPy和matplotlib, 可使用
Anaconda (包含numpy, scipy等科学计算常用
package)
安装注意问题:Python解释器版本(2.7 or 3.4?), 32-bit or 64-bit系统
Tips:1.把pycharm的中文包放进bin文件夹之后,不需要删除英文包(删除了会报错),重新pycharm即是中文界面。
2.安装Anaconda以及在pycharm中的配置方法:https://www.cnblogs.com/yuxuefeng/articles/9235431.html
3.Graphviz配置环境变量解决方案和下载地址:https://blog.csdn.net/qq_42685012/article/details/82850952