scikit-learn是一个开源的Python语言机器学习工具包,它涵盖了几乎所有主流机器学习算法的实现,并且提供一致的调用接口。
scikit-learn的一般性原理和通用规则
1评估模型对象
scikit-learn里的所有算法都以一个评估模型对象来对外提供接口。举例:svm.SVC()就是一个支持向量机评估模型对象。创建评估模型对象时,可以指定不同的参数,这个称为评估对象参数。
2模型接口
scikit-learn所有的评估模型对象都有fit()这个接口,这是用来训练模型的接口。predict(),可以用这个接口进行预测。几乎所有的模型都提供了score()(准确度)接口来评价一个模型的好坏,得分越高越好。
3模型检验
除了score()之外,sklearn.metrics包的下面还有一系列用来检测模型性能的方法。
4模型选择
(这是从scikit-learn机器学习-黄永昌的所得,这本书不错。)