机器学习----基础知识

机器学习的特点:

  1. 机器学习算法以数据和特征为基础,是数据驱动的科学;
  2. 机器学习的目标是对数据进行预测与分析;
  3. 机器学习以模型方法为中心,并利用统计学习的方法构建模型,并且利用构建好的模型对未知的数据进行预测和分类;
  4. 机器学习是以概率论、统计学、信息论、计算理论、最优化以及计算机科学等多领域交叉的学科,因此要想在机器学习上有所成绩,必须要有深厚的数学基础。  

机器学习的对象:

特征:是最后需要输入到模型中进行训练的多维数据向量,它是来自于各种不同类型的数据(如数字、文本、图像、音频、视频等)转换,这个转换的过程就是机器学习与数据挖掘领域很重要的一个步骤:“特征工程”。

机器学习的分类:

根据训练数据是否有标记信息,学习任务可大致分为两类:有监督学习(分类-离散值和回归-连续值)和无监督学习(聚类)。

严格意义上的机器学习算法可分为四大类:

有监督学习:是指训练的数据既包含特征向量又包含类别标签信息。即在训练的过程中,知道每个样本所示的类别或者回归算法中的结果。训练过程根据类标对参数进行调整。

无监督学习:训练数据集只有每个数据实例的特征向量没有其所属的标签结果。

半监督学习:结合有监督学习和无监督学习,主要解决的问题是:样本很难收集或者有类标的样本很少。

强化学习:是智能系统从环境到行为映射的学习

机器学习的要素:

  • 模型:其实就是机器学习训练的过程中所要学习的条件概率分布或者决策函数。

  • 策略:就是使用一种什么样的评价,度量模型训练过程中的学习好坏的方法,同时根据这个方法去实施的调整模型的参数,以期望训练的模型将来对未知的数据具有最好的预测准确度。

  • 算法:算法是指模型的具体计算方法。它基于训练数据集,根据学习策略,从假设空间中选择最优模型,最后考虑用什么样的计算方法去求解这个最优模型。

特征!!!!

机器学习的建模过程:

-----参考章华燕老师的课程

猜你喜欢

转载自blog.csdn.net/zhourunan123/article/details/80027919