机器学习体系

大致提纲如下:
这里写图片描述

1.数学

线性代数、微积分
在整个机器学习过程中涉及大量矩阵运算和微积分导数的概念,因此建议初学者至少要有较为扎实的数学基础,对矩阵和微积分的概念了解比较清楚。否则在一些公式推导过程中会遇到较大障碍。

2.编程语言

Python/R/Java/Matlab 7 Steps to Mastering Machine Learning With Python
Python已经成为机器学习的第一语言,众多机器学习的框架都支持Python API。

3.监督学习

监督学习指的是人们给机器一大堆标记好的数据(label),比如一大堆照片,标记出哪些是猫的照片,哪些不是,然后让机器自己学习归纳出算法,可以判断出其他照片是否是猫,用于未来其他数据的预测判断使用。
监督学习目标就是,假定给一组训练数据,可以学习到一个函数方法h,可以使得h(x) -> y。这个函数方法h被称为假设(hypothesis)。整体流程如下:
监督学习流程图

监督学习根据输出数据又分为回归问题(Regression)和分类问题(Classfication)。回归问题通常输出是一个连续的数值,分类问题的输出是几个特定的数值。
举例如下:
(a) 回归问题 - 给定一张人脸照片,估计出这个人的年龄(年龄输出是一个连续的数值)
(b) 分类问题 - 假定一个人患有肿瘤,判断是为恶性还是良性(恶性和良性的输出是几个特定的数值)
目前监督学习领域算法代表:Linear regression, Logistic regression, Neural network, SVM等等。
线性回归(Linear regression)机器学习知识体系 - 线性回归
逻辑回归( Logistic regression)机器学习知识体系 - 逻辑回归
神经网络(Neural network)机器学习知识体系 - 神经网络(基础)机器学习知识体系 - 神经网络(反向传播算法)
支持向量机(SVM)SVM支持向量机 SVM支持向量机

4.无监督学习

非监督学习指的就是人们给机器一大堆没有标记的数据,让机器可以对数据进行分类、检测异常等。其所学习的数据没有属性或标签,对于给定的数据集,无监督学习算法可能判定,该数据集包含不同的聚类,并且能够归纳出哪些数据是一个聚类。
K-means深入浅出K-Means算法
PCA: 主成份分析算法 PCA
Anomaly detection: 异常检测

5.特殊主题

推荐系统Recommend system
Large scale machine learning application
一些特殊算法,例如推荐系统。常用于购物网站,可以根据你的过往购物或评分情况,来向你推荐商品。

6. 机器学习调优和分析

Bias/vairance: Understanding the Bias-Variance Tradeoff
Regulation
Learning curve
Error analysis: Accurately Measuring Model Prediction Error
Celling analysis
机器学习的建议,包含参数正则化、学习曲线、错误分析、调参等。

7.深度学习

Neural Netwotk
深度学习是近期机器学习的一个热门分支,模拟人类大脑的思维方式,可以极大的提高正确率,是近来机器学习的一个非常大的突破。
CNN:卷积神经网络全面解析 零基础入门深度学习(4) - 卷积神经网络

8.工具框架

TensorFlow/Theano/Keras
很多大厂就开源了一些机器学习的框架,基于这些框架可以很容易搭建机器学习的平台。
TensorFlow and Deep Learning without a PhD, Part 1
TensorFlow and Deep Learning without a PhD, Part 2

推荐的学习资料:
Github上面有一份非常详尽的学习路径 awesome-deep-learning
零基础入门深度学习:一位大神写的关于深度学习的入门教程,由浅入深的详细介绍了深度学习的几个重要内容,非常适合入门的学习。

扫描二维码关注公众号,回复: 2183954 查看本文章

猜你喜欢

转载自blog.csdn.net/daydayup_668819/article/details/79728580