带你了解数据挖掘中的算法

版权声明:系CDA数据分析师原创作品,转载需授权 https://blog.csdn.net/yoggieCDA/article/details/91389059

关于数据挖掘的算法有很多,而这些算法都是能够帮助我们去解决很多的问题,所以说我们要重视数据挖掘算法的学习。在这篇文章中我们重点为大家介绍关于数据挖掘的算法,希望这篇文章能够更好地帮助大家去理解数据挖掘。

1.Apriori算法

首先我们说的是The Apriori algorithm,Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。这个算法是比较复杂的,但也是十分实用的。

2.最大期望算法

在统计计算中,最大期望算法是在概率模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量。最大期望经常用在机器学习和计算机视觉的数据集聚领域。而最大期望算法在数据挖掘以及统计中都是十分常见的。

3.PageRank算法

PageRank是Google算法的重要内容。PageRank里的page不是指网页,而是创始人的名字,即这个等级方法是以佩奇来命名的。PageRank根据网站的外部链接和内部链接的数量和质量俩衡量网站的价值。PageRank背后的概念是,每个到页面的链接都是对该页面的一次投票,被链接的越多,就意味着被其他网站投票越多。这个就是所谓的“链接流行度”,这个标准就是衡量多少人愿意将他们的网站和你的网站挂钩。PageRank这个概念引自学术中一篇论文的被引述的频度——即被别人引述的次数越多,一般判断这篇论文的权威性就越高。

4.AdaBoost算法

Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,然后把这些弱分类器集合起来,构成一个更强的最终分类器。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。这种算法给数据挖掘工作解决了不少的问题。

在这篇文章中我们给大家介绍了数据挖掘中的四个算法,具体分为Apriori算法、最大期望算法、PageRank算法、AdaBoost算法。在学习数据挖掘知识的时候我们一定要好好学习它的算法,这样我们才能够提高数据挖掘的能力。

猜你喜欢

转载自blog.csdn.net/yoggieCDA/article/details/91389059