带你了解数据挖掘中的算法

关于数据挖掘的算法有很多，而这些算法都是能够帮助我们去解决很多的问题，所以说我们要重视数据挖掘算法的学习。在这篇文章中我们重点为大家介绍关于数据挖掘的算法，希望这篇文章能够更好地帮助大家去理解数据挖掘。

1.Apriori算法

首先我们说的是The Apriori algorithm，Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里，所有支持度大于最小支持度的项集称为频繁项集，简称频集。这个算法是比较复杂的，但也是十分实用的。

2.最大期望算法

在统计计算中，最大期望算法是在概率模型中寻找参数最大似然估计的算法，其中概率模型依赖于无法观测的隐藏变量。最大期望经常用在机器学习和计算机视觉的数据集聚领域。而最大期望算法在数据挖掘以及统计中都是十分常见的。

3.PageRank算法

PageRank是Google算法的重要内容。PageRank里的page不是指网页，而是创始人的名字，即这个等级方法是以佩奇来命名的。PageRank根据网站的外部链接和内部链接的数量和质量俩衡量网站的价值。PageRank背后的概念是，每个到页面的链接都是对该页面的一次投票，被链接的越多，就意味着被其他网站投票越多。这个就是所谓的“链接流行度”，这个标准就是衡量多少人愿意将他们的网站和你的网站挂钩。PageRank这个概念引自学术中一篇论文的被引述的频度——即被别人引述的次数越多，一般判断这篇论文的权威性就越高。

4.AdaBoost算法

Adaboost是一种迭代算法，其核心思想是针对同一个训练集训练不同的分类器，然后把这些弱分类器集合起来，构成一个更强的最终分类器。其算法本身是通过改变数据分布来实现的，它根据每次训练集之中每个样本的分类是否正确，以及上次的总体分类的准确率，来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练，最后将每次训练得到的分类器最后融合起来，作为最后的决策分类器。这种算法给数据挖掘工作解决了不少的问题。

在这篇文章中我们给大家介绍了数据挖掘中的四个算法，具体分为Apriori算法、最大期望算法、PageRank算法、AdaBoost算法。在学习数据挖掘知识的时候我们一定要好好学习它的算法，这样我们才能够提高数据挖掘的能力。

带你了解数据挖掘中的算法

猜你喜欢