问Z得分连续归一化r数据帧
EN

Stack Overflow用户

提问于 2018-07-02 10:51:47

回答 1查看 143关注 0票数 0

我想通过使用函数scale()计算z- data.frame来归一化R分数。

然而，我不确定这种方法是否会受到“前瞻性偏差”的影响，这是一个金融术语，指的是在分析期间不知道或不能使用的功能。

这些是股票回报，我想使用这些数据进行“反向测试”(一个用于验证的金融术语)。在计算z-score时，我希望确保每个周期的z-score只使用该点之前可用的数据，而不是整个序列的平均值和std。

有谁知道如何计算这个值吗？还是有不同的方法？

发布于 2018-07-02 11:05:22

您可以标准化数据或使用标准化创建新功能，而无需担心“前瞻性”偏差。这是很常见的。

您只是不使用任何在分析期间不可用的数据来执行此操作。

与目标编码或其他特征工程技术非常相似，您只需在历史数据的训练子集上创建这些特征，然后在验证拆分上对其进行验证。您还可以考虑KFold交叉验证。

如果你想用一个可重复的例子来补充你的问题，我可以展示给你看。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51128593

复制

相似问题

问Z得分连续归一化r数据帧EN