最近推特( 宣布 )表示,你可以用以下公式输入推特用户的追随者数,从而以较高的精度近似于任何推特用户的排名:
exp($a + $b * log(follower_count))
其中$a=21和$b=-1.1
这显然比按给定用户的跟随者计数对整个用户列表进行排序要高效得多。
如果您有来自不同社交网站的类似数据集,那么如何才能为$a和$b导出适合该数据集的值?基本上,一些频率的列表,其分布被假定为幂律。
发布于 2011-01-05 23:12:03
您有以下模式:
y = exp(a + b.log(x))相当于:
log(y) = a + b.log(x)因此,如果您获取数据集的日志,您将得到一个线性模型,因此您可以使用线性回归来确定a和b的最佳匹配值。
然而,这一切对我来说都是毫无意义的。谁可以说一个给定的网络站点使用这种关系来决定用户的排名呢?
发布于 2011-01-05 23:46:15
您可以使用名为"Solver“的Microsoft外接程序。它包含在Excel中,但在默认情况下并不总是安装。在Excel版本中查找“外接程序”和“解决程序”,并加载它。
安装外接程序后,执行以下操作:
https://stackoverflow.com/questions/4610132
复制相似问题