首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Pagerank -麻烦

Pagerank -麻烦
EN

Stack Overflow用户
提问于 2011-01-20 10:33:05
回答 2查看 427关注 0票数 1

我将给你们展示两个场景(N.B. d=damping factor=0.5)

第一个场景:假设有4个节点A, B, C, D

  • B, C, D链接在A上。

PageRank是:PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))

我可以通过将0.25放在PR(B)=PR(C)=PR(D)上来解决这个方程,我将得到0.875的值。我不需要解决任何系统

第二个场景:假设有4个节点A, B, C, D

  • A链接在BC
  • BC上的链接
  • CA上的链接

以这种方式,PageRank将是:

PR(A)=0.5 + 0.5 * PR(C)

PR(B)=0.5 + 0.5 * ((PR(A))/(2))

PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))

我必须解决这个系统才能得到结果。我不把1/N放在PR(A), PR(B), PR(C) and PR(D)

事实上,我在互联网上搜索解决方案,其价值如下:

$PR(A) = 14/13 =1.07692308美元

$PR(B) = 10/13 =0.76923077美元

$PR(C) = 15/13 =1.15384615美元

那么,为什么在两种类似的场景中,我使用了两种不同的行为?

希望有人能帮我:)干杯

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-01-20 15:30:44

由于第一个问题中的对称性,这两种场景是不同的: B、C和D链接和从相同的页面链接(即它们都指向A而没有指向它们)。因此,他们的页面排名将是相同的,这给了您额外的约束,PR(B)=PR(C)=PR(D),使您能够轻松地解决问题。

第二个问题没有对称性,需要长时间的解决。

票数 1
EN

Stack Overflow用户

发布于 2013-10-19 09:42:51

假设一个由四个网页组成的小宇宙: A、B、C和D。从一个页面到自己的链接,或者从一个页面到另一个页面的多个出站链接,都会被忽略。对于所有页面,PageRank都初始化为相同的值。在最初的PageRank格式中,所有页面上的PageRank之和是当时在web上的总页数,因此本例中的每个页面的初始PageRank为1。然而,较晚版本的PageRank以及本节的其余部分假设概率分布在0到1之间。因此,每个页面的初始值为0.25。

在下一次迭代中,从给定页面转移到其出站链接目标的PageRank在所有出站链接之间平均分配。

如果系统中唯一的链接是从页面B、C和D到A,那么每个链接在下一次迭代时都会将0.25 PageRank传递到A,总共为0.75。

PR(A)= PR(B) + PR(C) + PR(D)

假设B页有到C页和A页的链接,C页有到A页的链接,D页有指向所有三页的链接。因此,在下一次迭代时,页B将其现有值的一半或0.125转移到A页,另一半或0.125页转移到C页。C页将将其所有现有值0.25转移到它链接到的唯一页面。由于D有三个出站链接,它将将其现有值的三分之一或大约0.083转移到A。在完成该迭代时,A页的PageRank为0.458。

PR(A)= {PR(B)}{2}+ \frac{PR(C)}{1}+ \frac{PR(D)}{3}.\,

换句话说,出站链接授予的PageRank等于文档自己的PageRank分数除以出站链接L( )的数量。

PR(A)= {PR(B)}{L(B)}+ \frac{PR(C)}{L(C)}+ \frac{PR(D)}{L(D)}

在一般情况下,任何页u的PageRank值都可以表示为:

PR(u) = \sum_{v \in B_u} \frac{PR(v)}{L(v)},

即,页u的PageRank值依赖于集Bu中包含的每个页v的PageRank值(包含链接到页u的所有页面的集合),除以页v中链接的数L(v)。

如需进一步查询,请访问此处

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4745997

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档