机器学习(十三) 集成学习和随机森林(下)

五、随机森林和 Extra-Trees

六、Ada Boosting 和 Gradient Boosting

七、Stacking

 

 

 

 八、学习scikit-learn文档,

官方学习文档: http://scikit-learn.org

 http://scikit-learn.org/stable/user_guide.html

今年,Kaggle刚刚上线了Kaggle Learn模块,使用Kaggle的数据,来一点点进行机器学习实战。可以参考:https://www.kaggle.com/learn/overview

其次,对于Kaggle的入门级比赛,有很好的Tutorial,请看这个页面的所有Tutorial,只针对一个泰坦尼克数据,使用不同方案解决,是很好的步入机器学习竞赛的第一步:https://www.kaggle.com/c/titanic#tutorials

Kaggle官方博客也有很多好的内容:http://blog.kaggle.com/

在你参加具体比赛的时候,Kaggle的论坛会是你的好帮手:https://www.kaggle.com/discussion

有人整理出了Kaggle比赛中很多问题的第一名的解决方案思路,其实这些内容都是引用上面Kaggle的官方博客或者论坛的内容:)

http://ndres.me/kaggle-past-solutions/

猜你喜欢

转载自www.cnblogs.com/zhangtaotqy/p/9588853.html
今日推荐