首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >社交网络查询的幂律曲线拟合

社交网络查询的幂律曲线拟合
EN

Stack Overflow用户
提问于 2011-01-05 23:06:29
回答 2查看 980关注 0票数 3

最近推特( 宣布 )表示,你可以用以下公式输入推特用户的追随者数,从而以较高的精度近似于任何推特用户的排名:

exp($a + $b * log(follower_count))

其中$a=21和$b=-1.1

这显然比按给定用户的跟随者计数对整个用户列表进行排序要高效得多。

如果您有来自不同社交网站的类似数据集,那么如何才能为$a和$b导出适合该数据集的值?基本上,一些频率的列表,其分布被假定为幂律。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-01-05 23:12:03

您有以下模式:

代码语言:javascript
复制
y = exp(a + b.log(x))

相当于:

代码语言:javascript
复制
log(y) = a + b.log(x)

因此,如果您获取数据集的日志,您将得到一个线性模型,因此您可以使用线性回归来确定ab的最佳匹配值。

然而,这一切对我来说都是毫无意义的。谁可以说一个给定的网络站点使用这种关系来决定用户的排名呢?

票数 6
EN

Stack Overflow用户

发布于 2011-01-05 23:46:15

您可以使用名为"Solver“的Microsoft外接程序。它包含在Excel中,但在默认情况下并不总是安装。在Excel版本中查找“外接程序”和“解决程序”,并加载它。

安装外接程序后,执行以下操作:

  1. 创建一个新的工作表。在A栏中,将每个人的id (可选)
  2. B栏,追随者人数。
  3. 如果未对数据进行排序,则使用列B对其进行排序。
  4. 在C栏中排名(你知道,1,2,3,等等)
  5. 在单元格D1值为21,单元格E1值为-1.1。这些是$A和$B的Twitter值,是我们的基本值。他们可能会改变。
  6. 在单元格中,D2给出了这样的公式:=exp($E$1+$F$1*log(B2))
  7. 在数据末尾的D2复制公式。
  8. 在单元格中,E2提出了一个公式,将实际排序与公式的结果(即方差)进行比较。例如,=sqrt(c2*c2+d2*d2)。实际值和预测值越接近,该值就趋于0。
  9. 将单元格E2复制到数据的末尾。
  10. 在数据的底部,在E列,将差异之和。例如,假设您的数据有10,000个值。在单元格E10001上,输入=sum(e2:e10000)。
  11. 转到菜单数据,查找"Solver“菜单位置。位置可能非常取决于您的Excel版本。使用“帮助”工具寻找目标。
  12. 按照说明(我现在必须去),帮助使用解决方案插件。显然,变化的单元格是D1和E1,其目标是使E10001 (方差之和)尽可能接近于零。
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4610132

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档