机器学习之聚类、回归、分类算法

机器学习从学习的种类分为“无监督学习”(不对样本数据做任何标记甚至是过程干预)和“有监督学习”(总结训练样本向量与标签的映射关系)。

一。聚类:

是非常典型的无监督学习的一种。聚类的行为本源还是人自身。聚类是通过划分一个个范围,把输入样例进入符合条件的范围,通过映射关系输出一个合理的结果。类比于人类的行为,我们分的清猴子和汽车,猴子的种类很多,他们有些行为、样貌迥异,但是我们却不会把他们和汽车弄混,我们认为在一定的差异范围内,他仍然属于猴子的范围。

在这个过程中,从获得具体的样本向量,到得到聚类结果,人们是不用进行干预的,从而得到了“非监督”的概念。

二。回归

简单来说就是“由果索因”的过程,是一种归纳的思想。最常用的回归有两大类----线性回归,非线性回归。

Loss越小,越精准。会把收集到的数据集分为训练集和验证集。七三开,八二开都可以。训练集一侧用数据多的那部分。

非线性回归当属逻辑回归。

三。分类

在数据中使用最多的算法。涉及一个召回率和精确率。

猜你喜欢

转载自blog.csdn.net/ferrysoul/article/details/81900945