机器学习系列六:sklearn库

一、简介

Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.。

Sklearn 包含了很多种机器学习的方式:

  • Classification 分类
  • Regression 回归
  • Clustering 非监督分类
  • Dimensionality reduction 数据降维
  • Model Selection 模型选择
  • Preprocessing 数据预处理

二、sklearn库的结构

(1)结构: 
由图中,可以看到库的算法主要有四类:分类,回归,聚类,降维。其中:

常用的回归:线性、决策树、SVM、KNN ;集成回归:随机森林、Adaboost、GradientBoosting、Bagging、ExtraTrees
常用的分类:线性、决策树、SVM、KNN,朴素贝叶斯;集成分类:随机森林、Adaboost、GradientBoosting、Bagging、ExtraTrees
常用聚类:k均值(K-means)、层次聚类(Hierarchical clustering)、DBSCAN
常用降维:LinearDiscriminantAnalysis、PCA
(2)图片中隐含的操作流程: 
这个流程图代表:蓝色圆圈内是判断条件,绿色方框内是可以选择的算法。你可以根据自己的数据特征和任务目标去找到一条自己的操作路线,一步步做就好了。

三、sklearn库的学习

1.sklearn的官网链接http://scikit-learn.org/stable/index.html#

2.sklearn的API学习链接 

原文链接 : http://scikit-learn.org/stable/modules/classes.html

译文链接 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030193

3.sklearn学习的博客连接 

https://blog.csdn.net/luanpeng825485697/article/details/78347433

https://blog.csdn.net/fuqiuai/article/details/79495865

https://blog.csdn.net/u010859707/article/details/74995531

                         

猜你喜欢

转载自blog.csdn.net/qq_36086861/article/details/85695887