Google PageRank 是如何计算的
给一个网页计算PageRank,所有的来向链接都被计算进来了,包括网站内部的链接和网站外部的链接。PR(A) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C(tn))
上面是一个计算网页PageRank的方程式。这是个一最原始的方程式,是当PageRank被开发后公布的方程式,可能Google在使用上有所变化,但是他们不会告诉我们怎么回事。尽管如此,这个也是无关紧要的了,因为这个方程式也不是最好的。
在方程式里面t1 - tn是链接到网页A的网页,C是这些网页有多少个链出,d是一个[阻尼]因数,通常情况下设定为0.85。
我们可以把它简单的认为是:
一个网页的PageRank = 0.15 + 0.85*(链接到该网页的每一个叶面的PR平均值)
“平均值” = 链接网页的PageRank被拆分为多少个链出数量的值。
一个网页“投票”一定数量的PageRank给每一个它链接到的网页,被他投票的网页所获得的PageRank仅仅别投票网页的PageRank值小一点点(他自己的是*0.85)。这个值是平均分配给所有的该网也所链接到的网页。
从这个依据得出,我们可以计算得出,从一个PR4的有5个链出的网页的价值比一个PR8的100个链出的网页大。一个网页的PageRank的高低固然重要,但是有多少个链出在该网页上也同样重要。一个网页中越多链出,你所获得的PR就越少。
不管怎么说,从其他网站链接到自己的网站是一定会增加自己网站的PageRank的,但是要记住的是避免链接农场过来的链接。
需要注意的是,一个网页给其他的网页投票,他自己的PageRank并不会减少,投票并不会传输PageRank值,仅仅是基于自己网页的PageRank值作为参考。
现在看起来如何,应该大致清楚了,我们再来看看计算是如何进行的。
对于网页的计算,他已经有的PageRank值(假设他有一些)是完全无约束的,如果有一个新的网站链接到了该网页,那么就会重新计算该网页的PageRank值,该新值很可能和最近一次的计算值不相同。
方程式很清楚地显示了一个网页如何获得的PageRank值。但是为什么不能够立即显示出来该PageRank值呢,因为PageRank值需要不止一次的计算。假设我们有两个网页,A和B,他们都链接到对方,都没有其他任何方面的链接了,这将如何:
第一步:通过链入计算网页A的PageRank值
网页A现在有一个新的PageRank值。计算方式使用了链入网页B所获得的值。但是B也有一个链入网页(来自于A),这个时候他的新的PageRank值还没有被算出来,那么网页A的PageRank值现在数据不准确,不能确定。
第二步:通过链入计算网页B的PageRank值
网页B现在有一个新的PageRank值,但是同样因为它有一个新的来自于网页A的链接导致数据不准确。
这种情形,我们无法计算出网页A和B的PageRank值。
现在两个网页都有新的计算的PageRank值,我们为何不用实际的值来计算呢,不行,我们可以在此计算,但是使用新值,结果会更加精确,但是我们将会使用不正确的值来计算,最终结果值还是不正确。
问题将会反复。每次产生更精确的值。实际上,所有的计算结果都不对,因为我们总是使用不正确的值。这就是为什么Google总是更新,然后更新的时间需要那么长了。
我们需要记住的是我们获得的结果是平均值,数字需要平衡比例尺来获得网页的实际PageRank值。尽管如此,我们可以通过计算来引导网站的网页的PageRank值,那么这个网页就可以获得高于其他网页的PageRank值。
分享到: