图分析与PageRank算法

目录

Page Rank


图分析(graph analytics的目的是发掘隐藏在图中的统计规律或潜在结构。

PageRank算法是无监督学习方法,主要是发现有向图中的重要结点。

给定一个有向图,定义在图上的随机游走即马尔可夫链。

随机游走者在有向图上随机跳转,到达一个结点后以等概率跳转到链接出 去的结点,并不断持续这个过程。

PageRank算法就是求解该马尔可夫链的平稳分布的算法。

Page Rank

一个结点上的平稳概率表示该结点的重要性,称为该结点的PageRank值。被指向的结点越多,该结点的PageRank值就越大。被指向的结点的PageRank值越大,该结点的PageRank值就越大。PageRank值越大结点也就越重要。

图是一个简单的有向图,有 4 个结点 A,B,C,D
 
给定这个图, PageRank 算法通过迭代求出结点的 PageRank 值。
 
首先, 对每个结点的概率值初始化,表示各个结点的到达概率,假设是等概率的。下一步, 各个结点的概率是上一步各个结点可能跳转到该结点的概率之和。不断迭代,各个结点的到达概率分布趋于平稳分布,也就是PageRank值的分布。

猜你喜欢

转载自blog.csdn.net/weixin_41865104/article/details/113426440