机器学习中如何选择合适的算法

算法分类

首先,机器学习大的算法分为监督学习用途的算法和无监督学习用途的算法两大类。而监督学习的算法有k-近邻算法、朴素贝叶斯算法、支持向量机算法、决策树算法、线性回归算法、局部加权线性回归算法、Ridge回归算法、Lasso最小回归系数估计算法。而无监督学习算法有K-均值、DBSCAN、最大期望算法、Parzen窗设计等等。

算法目的

选择实际可以使用的算法,要考虑一下两个方面。一是使用这个算法的目的是什么,要完成什么样的任务,举最简单的例子来说,是分类算法还是预测算法。二是要考虑需要分析或者收集的数据是什么。
如果想要预测目标变量的值,可以选择监督学习算法,选择监督学习算法之后,确认目标变量的类型,如果是离散型的目标变量的话,那么可以选择分类器算法。离散型变量:是否、猫狗等这种类型的。如果目标变量是连续型数值的目标变量,例如0-100,那么可以选择回归算法。
如果不是预测目标变量的值的话,选择无监督算法,如果需要将数据划分为离散的组的话,选择聚类算法,如果除了划分离散的组的话,还要分析数据和每个组之间的相似程度的话,选择密度估计算法。
还要考虑数据的结构。充分了解数据的特征值是离散的还是连续的、数据是否缺失。
最后算法的选择只能是在一定范围内进行缩小,但是不能确定最佳的算法,需要尝试不同算法的执行结果。以便于达到最好的预测的目的。

发布了110 篇原创文章 · 获赞 72 · 访问量 21万+

猜你喜欢

转载自blog.csdn.net/qq_40605167/article/details/104091384