机器学习一：绪论（学习笔记）

1.机器学习四大应用领用

a.数据挖掘：发现数据之间的关系

b.计算机视觉：像人一样看懂世界

c.自然语言处理：像人一样看懂文字

d.机器决策：像人一样有决策判断的能力

2.数据挖掘案例分析

案例一：血糖值的预测

根据一个人的体检信息，来预估这个人的血糖值的高低。

已知：大量的样本，每一个样本是一个人的体检信息

问题: 求一个数学函数f,其参数输入为样本信息（如一个人的性别，年龄，总蛋白，白蛋白，淋巴细胞，血小板计数等），来输出血糖值。

机器学习的任务就是根据已知的这些样本信息数据，学习出一样函数f。这类问题通常称为回归问题：因为要拟合的函数输出是连续值（血糖值是连续的小数）

案例二：有无糖尿病的预测

已知：大量的样本，每一个样本是一个人的体检信息

问题: 求一个数学函数f,其参数输入为样本信息（如一个人基因信息SNP1，身高、BMI分类、SNPSS等），来输一个人是否患有糖尿病（0表示不患病，1表示患病）。这类问题统称为分类问题：因为函数输出的为离散值，代表的是类别信息，即该样本属于哪个类别）。

3.机器学习概念介绍

a.机器学习两大基本问题

回归问题

分类问题

机器学习处理的问题很复杂，但本质上属于此两类问题或是该两类问题的组合

b.什么是机器学习

根据已知数据，学习出一个数学函数f(x1,x2,x3,...,xn) = y,使其具有很强的预测能力

c.专有名词介绍

机器学习模型：f

features: 特征。如案例一中的一个人的性别，年龄，总蛋白，白蛋白，淋巴细胞，血小板计数等。

label ：标记或标签。如案例一中的血糖值。

注：机器学习就是从 features----> label 的 f 求解过程

样本：一条数据成为样本

数据集：所有样本数据的集合

4.计算机视觉案例

案例三：图像分类

求一个机器学习模型f，使其

原始图像---in--->f---out--->类别

（应用案例一个是微信小程序：猜画小歌）

案例四：目标检测

目标检测比图像分类更为复杂，不仅要检测出图片中所有物体的类别，还要计算出该物体在图片中的位置坐标信息

原始图像---in--->f---out--->lable

该lable要包含物体的类别与其相应的位置信息参数

数据集：一般都是由人工进行标注，一般由大公司花费大量人力完成的并公布出来给予全球学者学习使用

案例五：语义分割（切割图像，有点像抠图的感觉）

与目标检测相比，语义分割更为精确，仅仅分割出自身的信息。

本质上讲仍是分类问题，即对每个像素点进行分类：f([ $x_{i}$ , $y_{i}$ ]) = y, [ $x_{i}$ , $y_{i}$ ]表示第i个像素点

原始图像---in--->f---out--->lable

例如场景理解（常应用于无人驾驶领域），就是语义分割中的一个典型应用

5.自然语言处理案例

案例六：如文本分类、自动生成文本摘要、翻译等

案例七：问答

query+test---input--->f---output--->answer

案例八：人机对话

一句话---input--->f---output--->一句应答

（应用案例：微软小冰）

案例12:image to text

image---input--->f---output--->text

6.机器决策问题案例

案例九：End to end级别自动驾驶

案例十：机械臂开门

在模拟仿真环境中训练出函数模型，再在真实环境中进行少量训练，对基础模型微微调整，使其能更好的将训练模型

从虚拟环境中迁移到实际环境中。

相机---一张图片--->f---控制信号--->车辆

7.总结

传统监督学习/深度学习：案例1血糖值预测、案例2有无糖尿病预测

深度学习：自然语言处理案例、计算机视觉案例、end to end级无人驾驶

深度学习+强化学习：机械臂开门

last:建议学习路线

传统监督学习--->深度学习--->强化学习