scala机器学习

(1)模型分析

线性回归模型 GBT模型 随机森林模型
小型训练数据集,精度不高 一次训练一棵树,减少了树的偏差 并行训练多棵树,不太容易过拟合,减少了树的方差;调整随机森林更容易.
     

(2)电信客户流失分析预测

  DT(决策树)      
  DT是一种监督学习,可以用来解决分类和回归问题.      
优点

- 方便实现,训练和解释

- 树可以可视化

- 高精度

- 抗噪声和缺失值

     
缺点

- 大而复杂的树很难解释

- 在同一子树中可能发生重复

- 可能有对角决策边界问题

     
在以下领域表现更好

- 针对高度精确的分类

- 医学诊断和预测

扫描二维码关注公众号,回复: 9865704 查看本文章

- 信用风险分析

     
发布了30 篇原创文章 · 获赞 1 · 访问量 1095

猜你喜欢

转载自blog.csdn.net/apawnchuck_129/article/details/103834657