可参考:http://www.pianshen.com/article/6504309498/
1、转换器
想一下之前做的特征工程的步骤?
1 实例化 (实例化的是一个转换器类(Transformer))
2 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)
我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式
fit_transform
fit 得到数据的均值、标准差
transform 根据fit步骤得到的转换参数,去转换特征
2、估计器
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API
1 用于分类的估计器:
sklearn.neighbors k-近邻算法
sklearn.naive_bayes 贝叶斯
sklearn.linear_model.LogisticRegression 逻辑回归
sklearn.tree 决策树与随机森林
2 用于回归的估计器:
sklearn.linear_model.LinearRegression 线性回归
sklearn.linear_model.Ridge 岭回归
3 用于无监督学习的估计器
sklearn.cluster.KMeans 聚类