我制作了一个时间系列,显示了意大利南部的电子价格和他们生产电力能源的两种最重要的商品(商品、天然气)。因此,我将所有这些数据输入到DataFrame中,其中有以下详细数据:
这些数据是从2010年到2022年的时间范围内,所以12年的历史时间数据。DataFrame头看起来如下所示:
PETROIL GAS ELECTRICITY
0 64.138395 2.496172 68.608696
1 65.196161 2.482612 113.739130
2 64.982403 2.505938 112.086957
3 64.272606 2.500000 110.043478
4 65.993436 2.521739 95.260870因此,在这个DataFrame上,我试图通过Pandas .corr() (使用Pearson方法)构建关联矩阵,并面临一个大问题:
如果我把12年作为数据,我会得到:
如果我试图在三个时间区间(2010-2014年;2014-2018年;2018-2022年)分裂,那么每隔一段时间,两组(电-气,电-油)的相关性都很高,在0.60到0.90之间。
因此,我在此提出以下两个问题:
谢谢你的回答。
发布于 2022-10-23 20:04:55
这可能是因为你的数据在不同的时间框架内在不同的市场情况下的性质,详细地说明,这些是每一种市场情况,商品A和B的价格之间有很高的相关性:
在其他时间框架内,商品A和B之间的价格可以脱钩。因此,相关性是0:
0,因为值是相互独立的)现在,如果将所有这些值混合在一个桶中,结果就无法很容易地解释,因为您比较了不同市场情况下的值。这也被称为“比较苹果和橘子”,苹果和橘子是两种商品交易的不同市场环境。
事实上,即使是按年分组,也可能会被认为是太大的时间框架,无法立即看一看。一种方法是确定不同的时间框架,其中商品A和B预期将被关联(或不相关),作为市场状况之间边界的列表(例如,每个事件的一个边界驱动了商品的价格,从而改变了商品价格之间的相关性),然后计算每个单独时间框架的相关性,以使事件如何改变商品组合之间的相关性。
https://datascience.stackexchange.com/questions/114751
复制相似问题