我的AI之路(9)--使用scikit-learn

       看了深度学习理论和算法的一些书后想动手实践找感觉的话,scikit-learn.org是个很好的选择,一般书上给的例子都零散不成体系,而且往往只是书的作者本人用到过或者了解的那几个算法,或者干脆抄的框架工具网站上的示例闭嘴,而scikit-learn上面提供了有监督学习(Supervised Learning)的分类(Classification)和回归(Regression)、无监督学习(Unsupervised Learning)的数据聚类(Clustering)和数据降维(Dimensionality Reduction)的多种常用算法的python代码实现,API非常写得非常友好易懂,示例解说比较清楚,文档写得很全面,有安装说明,在Documentation菜单里有在线Tutorials、API说明,如果点击Documentation菜单里的PDF Documentation,还能生成一个2000多页的pdf文档可下载到本地看,内容应有尽有,十分方便完善,真是好人啦,以前很少见过开源网站的文档做得这么贴心的大笑。 网站上提供有参数和模型选择比较说明

Model selection

,还有一个很实用的东东隐藏在Tutorials里面,就是关于如何选择算法,这可是我看了的N本书上都没说的好东东:点菜单Documentation,然后点Tutorials,然后到页面靠底部位置点那个Choosing the right estimator

 可以看到下面这张大图:

     这张图说明了根据你的任务是(离散性)分类预测还是(连续性)数值预测、数据有无标签、样本数据规模等前提条件如何选择分类、回归、聚类、降维四大类算法中的某种合适算法,点击图上的热点还可以进入相应的文档,这个东东真的很有用,以前看了的书上都是哇哩哇啦的说一堆算法,根本没这么理清楚关系,看了这图一下有了醍醐灌顶豁然开朗的感觉得意。 

       sckit-learn虽然不能做分布式计算,据说也不能处理大规模级别数据,但是它提供常用算法的python代码实现和清楚明晰的API说明和指南文档对于我们用于学习和熟悉算法的使用来说裨益很大,而且只需要安装Python和numpy、scipy等相关支持包既可以用起来,无需使用TF等框架,创建和维护scikit-learn的人实在是活雷锋啊,感动ing哭   它加速了我的梦想实现:尽快熟悉N种算法,哪天能参加Kaggle竞赛... 偷笑

我的AI之路(1)--前言

我的AI之路(2)--安装Fedora 28

我的AI之路(3)--安装Anaconda3 和Caffe

我的AI之路(4)--在Anaconda3 下安装Tensorflow 1.8

我的AI之路(5)--如何选择和正确安装跟Tensorflow版本对应的CUDA和cuDNN版本

我的AI之路(6)--在Anaconda3 下安装PyTorch

我的AI之路(7)--安装OpenCV3_Python 3.4.1 + Contrib以及PyCharm

我的AI之路(8)--体验用OpenCV 3的ANN进行手写数字识别及解决遇到的问题

我的AI之路(9)--使用scikit-learn

我的AI之路(10)--如何在Linux下安装CUDA和CUDNN

我的AI之路(11)--如何解决在Linux下编译OpenCV3时出现的多个错误

我的AI之路(12)--如何配置Caffe使用GPU计算并解决编译中出现的若干错误

我的AI之路(13)--解决编译gcc/g++源码过程中出现的错误

我的AI之路(14)--Caffe example:使用MNIST数据集训练和测试LeNet-5模型

我的AI之路(15)--Linux下编译OpenCV3的最新版OpenCV3.4.1及错误解决

我的AI之路(16)--云服务器上安装和调试基于Tensorflow 1.10.1的训练环境

我的AI之路(17)--Tensorflow和Caffe的API及Guide

我的AI之路(18)--Tensorflow的模型安装之object_detection

猜你喜欢

转载自blog.csdn.net/XCCCCZ/article/details/80643790