机器学习前言之基本概念

目录


基本概念

  • 在机器学习中,一般将样本分成独立的三部分:
    训练集(train set):用于建立模型
    验证集(validation set):用来确定网络结构或者控制模型复杂程度的参数(优化)
    测试集(test set):则检验最终选择最优的模型的性能如何
  • 特征向量(feature vector):属性的集合,通常用一个向量来表示,附属于一个实例
  • 标记(label):实例类别的标记
    如下图: 4个训练集,6个属性,标记是享受运动中的是或否
    图1 分类训练集
  • 正(反)例(positive/negative example):如上图中享受运动的标记为“是”的是正例,为“否”的是反例
  • 分类(classification)和回归(regression):目标标记为类别型数据的是分类;目标标记为连续型数值的是回归
    在这里插入图片描述
    回归示例如下:
    图2 回归训练集
  • 有监督学习(supervised learning):训练集有类别标记
    无监督学习(unsupervised learning):训练集无类别标记
    半监督学习(semi-supervised learning):有类别标记的训练集+有无类别标记的训练集
    例如:研究肿瘤的良、恶性于尺寸,颜色之间的关系
    特征值:肿瘤尺寸,颜色
    标记:良性/恶性
    在给定训练集中,只有特征值的数据信息而且有没有标记则为有监督学习,以此类推
    在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_33208851/article/details/91354105
今日推荐