首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >跟踪相关趋势的算法

跟踪相关趋势的算法
EN

Stack Overflow用户
提问于 2017-10-06 08:01:00
回答 1查看 68关注 0票数 0

我正在使用、文章、标记(它们之间的关系是n:m)来开发一个网站。网站的一个重要部分是通过标签过滤文章。标记具有一定的权重,表示它们的相对重要性。权重随时间而变化(每天一次),这取决于它们被用于过滤文章的频率(hits)。

我应该用什么算法来计算权重?主要标准:

  • 根据历史数据(hits),但相当短的时间(~持续10-20天)
  • 过去数据的相关性随着时间的推移而下降(昨天的点击比10天前的点击率更重要)
  • 尊重标签的“个人趋势”(一天内从100次到200次的标签胜过连续两天点击200次的标签)。
  • 尊重新标签(没有历史记录)
  • 在过去的几天里没有得到多少点击的尊重标签(高权重的标签自然会得到更多的点击,所以“弱”标签应该会偶尔得到“打破圆圈”的机会)。
EN

回答 1

Stack Overflow用户

发布于 2017-10-06 23:34:15

我建议以下标签重量公式:

代码语言:javascript
复制
Score = c1 * Hits(today) + c2 * (Hits(today) - Hits(yesterday)) + c3 * Random
Weight = a * Score + (1 - a) * Weight(yesterday)

哪里

  • 随机-随机值0..1
  • c1,c2,c3,a-适当的常量值,0<a<1
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46601049

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档