机器学习基本概念解释

版权声明:转载需注明出处 https://blog.csdn.net/suoxd123/article/details/88673699
  • 数据集(data set):一组用于机器学习的数据的集合
  • 示例(instance):数据集中的一条数据记录
  • 特征向量(feature vector):一个示例在数学上的表示
  • 训练数据(trainning data):使用机器学习用来建立模型的数据
  • 样本空间(sample space):训练数据中用于作为条件的数据,即预测时的输入值
  • 标记空间(label space):训练数据中用于作为结果的数据,即预测时的被预测值
  • 分类(classification):被预测值的结果数据是离散数据
  • 回归(regression):被预测值是连续数据
  • 聚类(clustering):被预测值在训练阶段并没有被明确指定
  • 训练(training):使用训练数据对机器学习算法进行训练
  • 监督学习(supervised learning):训练阶段有明确的标记数据,即初始状态有为数据做好数据标记,分类和回归都属于监督学习
  • 无监督学习(unsupervised learning):跟监督学习相对的概念,聚类属于无监督学习
  • 泛化(generalization):使用训练得到一个可用模型的过程,对新的样本数据的适用性好可以理解为模型的泛化能力强,也就是常规理解的归纳,即从各独立的示例中总结出的一般性规律的意思
  • 特化(specialzation):将训练出来的模型应用于新样本的过程,就是常规的演绎,即将一般规律应用于具体的独立的示例
  • 错误率(error rate):分类错误的样本数占样本总数的比例
  • 精度(accuracy):精度 = 1 - 错误率
  • 训练误差(trainning error):学习器在训练集上的误差
  • 泛化误差(generalization error):学习器在新样板上的误差
  • 过拟合(overfitting):把训练样本的自身特点当做所有潜在样本的一般性质进行学习,导致泛化性能下降。
  • 欠拟合(underfitting):跟过拟合相对,指对训练样本的一般性质学习的不够

点击查看Tensorflow系列文章


猜你喜欢

转载自blog.csdn.net/suoxd123/article/details/88673699
今日推荐