首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何规范依赖于发布日期的特性

如何规范依赖于发布日期的特性
EN

Data Science用户
提问于 2022-03-10 21:45:38
回答 1查看 57关注 0票数 1

做一个ML项目来预测我播客中的某个播客集的收听次数,我的播客将在头28天获得。

问题是,当我第一次开始录制播客的时候,播客将在头28天内获得70次收听,而现在是2年后,仅仅基于播客比我刚开始时更受欢迎的事实,它就可能获得200次收听。

你如何解释这一变化,而没有模式不公平的权重是最现代的插曲?

例如:

代码语言:javascript
复制
Date, Category, Listens, Day Published

Aug 2020, Science, 70, Monday
Aug 2022, Topical, 200, Tuesday

我担心第二行特性将被学习到与更高的listens...even更相关,尽管这可能只是基于整个播客更受欢迎这一事实。

EN

回答 1

Data Science用户

回答已采纳

发布于 2022-03-13 21:32:16

一个非常简单的方法是基于移动平均值的值标准化。

例如,计算过去6个月中每个播客的平均avg数量,即取决于播客的日期。然后将原始侦听数替换为与avg相比的相对速率,即rate = (listens - avg) / avg。示例:

  • 当平均为70的时候,有80次收听的老播客被表示为一个积极的分数:{90-70)/70=0.28。
  • 当平均值为200时,最近有150次收听的是负数:(150-200)/200=-0.25。

当然,您可以根据数据的意义来调整移动平均值的计算。如果播客不是很有规律,您可以使用最后的N个播客,而不是最后的N个月。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/108958

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档