我想通过使用函数scale()计算z- data.frame来归一化R分数。
然而,我不确定这种方法是否会受到“前瞻性偏差”的影响,这是一个金融术语,指的是在分析期间不知道或不能使用的功能。
这些是股票回报,我想使用这些数据进行“反向测试”(一个用于验证的金融术语)。在计算z-score时,我希望确保每个周期的z-score只使用该点之前可用的数据,而不是整个序列的平均值和std。
有谁知道如何计算这个值吗?还是有不同的方法?
发布于 2018-07-02 11:05:22
您可以标准化数据或使用标准化创建新功能,而无需担心“前瞻性”偏差。这是很常见的。
您只是不使用任何在分析期间不可用的数据来执行此操作。
与目标编码或其他特征工程技术非常相似,您只需在历史数据的训练子集上创建这些特征,然后在验证拆分上对其进行验证。您还可以考虑KFold交叉验证。
如果你想用一个可重复的例子来补充你的问题,我可以展示给你看。
https://stackoverflow.com/questions/51128593
复制相似问题