机器学习基石——第三节课(笔记)

Learning with Different Output Space Y

  1. 二元分类 1 -1

  2. 多元分类 输出多余两个

  3. 回归分析 输出是个实数范围内的值

  4. 结构学习:结构化学习的输出空间包含了某种结构在里面,它的一些解法通常是从多分类问题延伸而来的,比较复杂。

learning with different data label yn

  1. 监督学习 (核心)

  2. 非监督学习<=>聚类、密度分析、outlier detection(大量中发现其中奇怪的)

  3. 半监督式:一部分数据有输出标签yn,而另一部分数据没有输出标签yn。

  4. 增强学习(Reinforcement Learning)。增强学习中,我们给模型或系统一些输入,但是给不了我们希望的真实的输出y,根据模型的输出反馈,如果反馈结果良好,更接近真实输出,就给其正向激励,如果反馈结果不好,偏离真实输出,就给其反向激励。不断通过“反馈­修”这种形式,一步一步让模型学习的更好,这就是增强学习的核心所在。

learning with different protocol f(xn,yn)

  1. batch learning是一种常见的类型。batch learning获得的训练数据D是一批的,即一次性拿到整个D,对其进行学习建模,得到我们最终的机器学习模型。

  2. online是一种在线学习模型,数据是实时更新的,根据数据一个个进来,同步更新我们的算法。

  3. active learning是近些年来新出现的一种机器学习类型,即让机器具备主动问问题的能力。优势之一是在获取样本label比较困难的时候,可以节约时间和成本,只对一些重要的label提出需求。

learning with different input space X

  1. concrete features:对机器学习来说最容易理解和使用。比如说硬币分类问题中硬币的尺寸、重量等;比如疾病诊断中的病人信息等具体特征。

  2. raw features:一般比较抽象,经常需要人或者机器来转换为其对应的concrete features,这个转换的过程就是Feature Transform。

  3. abstract features:特征X完全是抽象的,没有实际的物理含义。所以对于机器学习来说是比较困难的,需要对特征进行更多的转换和提取。

将一些抽象的特征转换为具体的特征,是机器学习过程中非常重要的一个环节。


猜你喜欢

转载自blog.csdn.net/qq_26269815/article/details/80845820