我正在做一个类似的微型论坛,一个快速(接近推特大小的)主题信息是由一个特殊的用户发布的,用户可以用他们自己的大小相同的信息来回应。直截了当的,没有‘挖掘’或投票的任何类型,只是一个时间流的回应,每一个主题的信息。但交通流量很高。
我们希望使用0到10的等级,根据它们所对应的嗡嗡声来标记主题消息。
谷歌搜索趋势算法和开源社区应用程序的例子已经有一段时间了,到目前为止已经收集到了两个有趣的参考资料,我还没有完全了解到:
从第一开始,我就明白了检查活动中的斜率的必要性,以及在两个活动规模上有很大差异的项目之间平衡权重的必要性。但是,我如何比较许多项目,随着时间的推移,数量迅速增长?然后,我如何打破在“嗡嗡声等级”从0到10的项目?
第二个参考是很吸引人的,但在这一点上超出了我的头脑。从第一遍开始,我就理解了在保持计数器和在必要时存储对项的引用的同时,需要保持内存使用的稳定。但我还没有从它中找到适合我的具体用例的算法。
值得注意的是,我来自非计算机科学和非统计学背景。请容忍我:)任何帮助和代码示例(特别是在Ruby中)将不胜感激。
发布于 2011-01-05 13:32:30
直觉说,一个解决这个问题的方法不需要太多的统计数据,根据一些简单的度量对主题进行排序可能已经为您提供了一个有趣的“趋势主题”的选择。
一种方法是按在最后一小时/一天/一周中生成的评论数量排序.并选择最上层的。
另一种方法是计算每个主题的评论数量,并将其除以主题的“年龄”。立即生成评论的新主题将被视为趋势,而具有许多评论的旧主题随着年龄的增长而变得不那么流行。
这些实现可以很容易地在Ruby/Rails中创建,甚至可以在SQL查询中完成,只要表中包含发布日期和注释数量。
https://stackoverflow.com/questions/4509563
复制相似问题