跟随李沐老师学习机器学习
机器学习基本分类
- 监督学习
- 自监督学习:标号来自数据的本身。
- 半监督学习:有一部分标号,还有大量的数据没有标号。可以简单概括为两个任务
- 像监督学习一样,训练模型预测标号,尽可能利用无标号的数据。
- 预测没有标号数据的标号,例如self-training
- 无监督学习
- 强化学习
监督学习
基本组成:
- 模型:将输入数据转化为目标输出。
- 损失:衡量预测值与真实值之间的差异,需要去定义用哪个函数去衡量。
- 目标函数:任务的最终目标,通常是使损失最小。
- 优化:通过学习模型的参数,来优化目标函数。
基础模型:
- 决策树
- 线性模型
- kernel machines: 用核函数来衡量两个样本的特征之间的相似度
- 神经网络