机器学习基础概念

1、机器学习的主要任务

分类：二分类、多分类（图像识别、数字识别等）、多标签分类（图像中目标检测）
注：复杂的问题也能转化为分类任务（如自动驾驶、下棋等），一些算法只能完成二分类任务，多分类可转换成二分类任务
回归（结果是一个连续的值，不是一个类别）：值的预测
注：回归任务可以简化成分类任务（成绩的预测→成绩属于哪一类）

输出结果为某一数值则为回归问题，结果为某一类别则为分类问题

①特征提取（去除不需要的特征）
②特征压缩（PCA）：在尽量少的减少数据损失的情况下将高维特征向量压缩成低维特征向量，方便可视化（三维以下的数据）
这里写图片描述
③异常检测
通过非监督学习可以将无标签的数据集进行分类，数据集中误差很大的数据即为异常数据

：注：先使用无监督学习对数据处理，之后用监督学习手段做模型训练和预测

这里写图片描述
算法为Agent，根据周围环境采取行动（action），行动过后得到环境的反馈（reward，奖励与惩罚），并得到下一步的状态（state），再根据反馈通过算法改变自己的行动。Agent在一次次循环之后逐渐增强智能。

批量学习

这里写图片描述
将输入样例输入模型后得到的结果和输入样例本来的正确结果得到差异并同时输入到算法中，不断更新。
例：股市里面预测一分钟后的股价，在一分钟后得到了正确的股价，将两种数据输入给算法进行学习，不断往复训练

将数据输入到模型后得到想要的参数（公式中的参数），得到参数后数据就没有用了，当有新的数据来的时候带入公式中即可得到预测的结果。如线性回归模型