版权声明:===========版权所有,可随意转载,欢迎互相交流=========== https://blog.csdn.net/weixin_42446330/article/details/84561790
以下是我的学习笔记,以及总结,如有错误之处请不吝赐教。
本文主要介绍sklearn工具库相关使用,以及部分内容解释,最后有相关案例代码。
首先看一张图,这张图是构建机器学习系统的一般流程:
还记得之前的一篇文章中有一张sklearn机器学习模型选择流程的一张图与此类似:没看过的请看过来
最常用sklearn部分:
使用sklearn库我们最常用到的是三个部分,分别是:
- scikit-learn Tutorials:主要是最基本的sklearn应用流程,以及示例
- User Guide:导航页和算法指南,主要是引导你选择何种算法
- API Reference,这个就是最重要的api页面,我们要调用任何api都可以在这里查到。它主要对应机器学习的几个流程:
- 数据预处理(preprocessing and normalizaiton)
- 特征抽取(feature extraction)
- 特征选择(feature selection)
- 各种模型算法
- 模型调优与超参数选择(model selection)
- 模型融合与增强(ensemble methods)
- 模型评估(metrics)
最基本用法:
- fit(拟合)
- transform(变换)
- fit_transform(拟合变换)
- predict(预测)
- predict_prob(预测概率)
如果你英文不是很好,这里还有贴心的中文api文档:scikit-learn 0.18 中文文档
最后,还是案例代码:欢迎关注我的github
To be continue.....