PageRank-google民主式网页排名技术

PageRank:

pagerank是一种很简单的思想,在互联网中如果一个网页被许多其他网页所链接,说明它普遍受到信任和依赖。那它的排名就高。当然实际算法更要复杂一点。比如不同的其它网站其可信度是不一样的。那些排名高的网站具有更高的可信度,应该赋予大的权重。该想法主要由佩奇提出。

这时有一个问题,当前网页的排名需要根据其它网页排名的高低赋予不同权重来计算当前网页的排名。这就变成了先有蛋还是先有鸡的问题。google的布林将这个问题转变为一个二维矩阵,使用迭代的方法解决了这个问题。他们先假定所有网页排名是相同的,根据初始值算出第一次迭代排名,然后根据第一个迭代排名计算出第二次迭代排名。他两从理论上证明不管初始值取多少,最终都能收敛到排名的真实值。就是也能理解在没有办法求解参数时,给定初始值,不断迭代到最优是个不错办法。

理论问题解决了,遇到了实际问题是这个矩阵有互联网上网页的2次方个元素。计算量过于巨大,二人采用稀疏矩阵巧妙解决问题。

迭代公式如下:

猜你喜欢

转载自blog.csdn.net/qq_16234613/article/details/82526066