文章/答案/技术大牛

发布

社区首页 >问答首页 >不同时间范围的不同相关系数

问不同时间范围的不同相关系数
EN

Data Science用户

提问于 2022-09-28 14:04:28

回答 1查看 20关注 0票数 0

我制作了一个时间系列，显示了意大利南部的电子价格和他们生产电力能源的两种最重要的商品(商品、天然气)。因此，我将所有这些数据输入到DataFrame中，其中有以下详细数据：

第一栏-日内石油期货日价格；
第二栏-N日天然气期货日价格；
第三栏-意大利电市场每日价格；

这些数据是从2010年到2022年的时间范围内，所以12年的历史时间数据。DataFrame头看起来如下所示：

     PETROIL       GAS  ELECTRICITY
0  64.138395  2.496172    68.608696
1  65.196161  2.482612   113.739130
2  64.982403  2.505938   112.086957
3  64.272606  2.500000   110.043478
4  65.993436  2.521739    95.260870

因此，在这个DataFrame上，我试图通过Pandas .corr() (使用Pearson方法)构建关联矩阵，并面临一个大问题：

如果我把12年作为数据，我会得到：

电力与石油价格的相关性几乎为零；
电价与电价的相关性较低(0.12)；

如果我试图在三个时间区间(2010-2014年；2014-2018年；2018-2022年)分裂，那么每隔一段时间，两组(电-气，电-油)的相关性都很高，在0.60到0.90之间。

因此，我在此提出以下两个问题：

当我把时间范围分开的时候，为什么会有这么大的差异呢？
考虑到我正在做这样的分析，用Petroil和天然气价格来预测电价，我应该考虑这两种分析中的哪一种？第一个(低相关)考虑整个时间范围，还是第二个(高相关)分裂成不同的时间范围？

谢谢你的回答。

pandas

feature-selection

correlation

data-analysis

回答 1

Data Science用户

发布于 2022-10-23 20:04:55

这可能是因为你的数据在不同的时间框架内在不同的市场情况下的性质，详细地说明，这些是每一种市场情况，商品A和B的价格之间有很高的相关性：

A下降<-> B增加(强负相关)
A增加<-> B减少(强负相关)
A增加<-> B增加(强正相关)
A减少<-> B减少(强正相关)
A稳定<-> B稳定(强正相关)

在其他时间框架内，商品A和B之间的价格可以脱钩。因此，相关性是0：

A下降对B没有影响
B下降对A没有影响
A的增加对B没有影响
增加对A没有影响
有时当B减少时A会增加，有时则相反(相关性仍然是0，因为值是相互独立的)

现在，如果将所有这些值混合在一个桶中，结果就无法很容易地解释，因为您比较了不同市场情况下的值。这也被称为“比较苹果和橘子”，苹果和橘子是两种商品交易的不同市场环境。

事实上，即使是按年分组，也可能会被认为是太大的时间框架，无法立即看一看。一种方法是确定不同的时间框架，其中商品A和B预期将被关联(或不相关)，作为市场状况之间边界的列表(例如，每个事件的一个边界驱动了商品的价格，从而改变了商品价格之间的相关性)，然后计算每个单独时间框架的相关性，以使事件如何改变商品组合之间的相关性。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/114751

复制

相似问题

问不同时间范围的不同相关系数
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不同时间范围的不同相关系数EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不同时间范围的不同相关系数
EN