我将给你们展示两个场景(N.B. d=damping factor=0.5)
第一个场景:假设有4个节点A, B, C, D:
B, C, D链接在A上。PageRank是:PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))
我可以通过将0.25放在PR(B)=PR(C)=PR(D)上来解决这个方程,我将得到0.875的值。我不需要解决任何系统
第二个场景:假设有4个节点A, B, C, D:
A链接在B和C上B在C上的链接C在A上的链接以这种方式,PageRank将是:
PR(A)=0.5 + 0.5 * PR(C)
PR(B)=0.5 + 0.5 * ((PR(A))/(2))
PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))
我必须解决这个系统才能得到结果。我不把1/N放在PR(A), PR(B), PR(C) and PR(D)上
事实上,我在互联网上搜索解决方案,其价值如下:
$PR(A) = 14/13 =1.07692308美元
$PR(B) = 10/13 =0.76923077美元
$PR(C) = 15/13 =1.15384615美元
那么,为什么在两种类似的场景中,我使用了两种不同的行为?
希望有人能帮我:)干杯
发布于 2011-01-20 15:30:44
由于第一个问题中的对称性,这两种场景是不同的: B、C和D链接和从相同的页面链接(即它们都指向A而没有指向它们)。因此,他们的页面排名将是相同的,这给了您额外的约束,PR(B)=PR(C)=PR(D),使您能够轻松地解决问题。
第二个问题没有对称性,需要长时间的解决。
发布于 2013-10-19 09:42:51
假设一个由四个网页组成的小宇宙: A、B、C和D。从一个页面到自己的链接,或者从一个页面到另一个页面的多个出站链接,都会被忽略。对于所有页面,PageRank都初始化为相同的值。在最初的PageRank格式中,所有页面上的PageRank之和是当时在web上的总页数,因此本例中的每个页面的初始PageRank为1。然而,较晚版本的PageRank以及本节的其余部分假设概率分布在0到1之间。因此,每个页面的初始值为0.25。
在下一次迭代中,从给定页面转移到其出站链接目标的PageRank在所有出站链接之间平均分配。
如果系统中唯一的链接是从页面B、C和D到A,那么每个链接在下一次迭代时都会将0.25 PageRank传递到A,总共为0.75。
PR(A)= PR(B) + PR(C) + PR(D)
假设B页有到C页和A页的链接,C页有到A页的链接,D页有指向所有三页的链接。因此,在下一次迭代时,页B将其现有值的一半或0.125转移到A页,另一半或0.125页转移到C页。C页将将其所有现有值0.25转移到它链接到的唯一页面。由于D有三个出站链接,它将将其现有值的三分之一或大约0.083转移到A。在完成该迭代时,A页的PageRank为0.458。
PR(A)= {PR(B)}{2}+ \frac{PR(C)}{1}+ \frac{PR(D)}{3}.\,
换句话说,出站链接授予的PageRank等于文档自己的PageRank分数除以出站链接L( )的数量。
PR(A)= {PR(B)}{L(B)}+ \frac{PR(C)}{L(C)}+ \frac{PR(D)}{L(D)}
在一般情况下,任何页u的PageRank值都可以表示为:
PR(u) = \sum_{v \in B_u} \frac{PR(v)}{L(v)},
即,页u的PageRank值依赖于集Bu中包含的每个页v的PageRank值(包含链接到页u的所有页面的集合),除以页v中链接的数L(v)。
如需进一步查询,请访问此处
https://stackoverflow.com/questions/4745997
复制相似问题