文章/答案/技术大牛

发布

社区首页 >问答首页 >如何规范依赖于发布日期的特性

问如何规范依赖于发布日期的特性
EN

Data Science用户

提问于 2022-03-10 21:45:38

回答 1查看 57关注 0票数 1

做一个ML项目来预测我播客中的某个播客集的收听次数，我的播客将在头28天获得。

问题是，当我第一次开始录制播客的时候，播客将在头28天内获得70次收听，而现在是2年后，仅仅基于播客比我刚开始时更受欢迎的事实，它就可能获得200次收听。

你如何解释这一变化，而没有模式不公平的权重是最现代的插曲？

例如：

Date, Category, Listens, Day Published

Aug 2020, Science, 70, Monday
Aug 2022, Topical, 200, Tuesday

我担心第二行特性将被学习到与更高的listens...even更相关，尽管这可能只是基于整个播客更受欢迎这一事实。

machine-learning

feature-engineering

normalization

回答 1

Data Science用户

回答已采纳

发布于 2022-03-13 21:32:16

一个非常简单的方法是基于移动平均值的值标准化。

例如，计算过去6个月中每个播客的平均avg数量，即取决于播客的日期。然后将原始侦听数替换为与avg相比的相对速率，即rate = (listens - avg) / avg。示例：

当平均为70的时候，有80次收听的老播客被表示为一个积极的分数：{90-70)/70=0.28。
当平均值为200时，最近有150次收听的是负数：(150-200)/200=-0.25。

当然，您可以根据数据的意义来调整移动平均值的计算。如果播客不是很有规律，您可以使用最后的N个播客，而不是最后的N个月。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/108958

复制

相似问题

问如何规范依赖于发布日期的特性
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何规范依赖于发布日期的特性EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何规范依赖于发布日期的特性
EN